3赞

使用哈希表在球拍中排序更快

作者：手机用户2402852387 | 2023-09-10 13:53

如何解决《使用哈希表在球拍中排序更快》经验，为你挑选了1个好方法。

所以我有一个像这样的元素的示例列表

(define A (list 'a 'c 'd 'e 'f 'e 'a))

现在我想从这个样本中进行排名

(define (scan lst)
    (foldl (lambda (element a-hash) (hash-update a-hash element add1 0))
           (hash)
           lst))

结果应该是这样的:

> #(('a . 2) ('f . 1) ('e . 2) ....)

因为`scan函数将使哈希表包含唯一键和该键的重复次数(如果它捕获未编制索引的键,它将为该新键创建一个新位置,从0开始计数).

然后我想对哈希表进行排序,因为它没有排序:

(define (rank A)
     (define ranking (scan A))         
     (sort ranking > #:key cdr)))

所以结果看起来像这样:

#(('a.2)('e.2)('f.1)......)

现在我想截断哈希表并在n = 1的阈值处抛弃底部(也就是说只采用重复次数超过2次的元素).

(define (truncate lst n)
    (define l (length lst))
    (define how-many-to-take 
        (for/list
             ([i l]
               #:when (> (cdr (list-ref lst i))
                          n))
               i))
    (take lst (length how-many-to-take)))

所以结果可能如下所示:

(('a.2)('e.2))

然而,在大规模,这个程序不是很有效,它需要太长时间.你有什么建议可以改善表现吗？

非常感谢你,

第2部分:

我有这个数据结构:

(automaton x 
   (vector (state y (vector a b c))  
           (state y (vector a b c)) ...))

然后我随机生成1000个人口.然后我使用上述功能扫描和排名.如果我只是按原样扫描它们,它已经需要很长时间.如果我试图将它们压平成这样的列表

(list x y a b c y a b c...)

它需要更多的时间.这是扁平功能:

(define (flatten-au au)
  (match-define (automaton x states) au)
  (define l (vector-length states))
  (define body
    (for/list ([i (in-range l)])
      (match-define (state y z) (vector-ref states i))
      (list y (vector->list z))))
  (flatten (list x body)))

扫描功能看起来有点不同:

(define (scan population)
    (foldl (lambda (auto a-hash) (hash-update a-hash (flatten-automaton auto) add1 0))
           (hash)
           population))

John Clement.. 5

是的,我相信我看到了问题.您的算法具有O(n ^ 2)("n平方")运行时间.这是因为你从一个到列表的长度计数,然后对于每个索引,执行a list-ref,这需要与索引的大小成比例的时间.

这非常容易修复.

事实上,如果这是你想要的,那么没有理由对它进行排序或将其转换为列表; 只是直接过滤哈希表.像这样...

#lang racket

(define A (build-list 1000000 (? (idx) (random 50))))

(define (scan lst)
    (foldl (lambda (element a-hash) (hash-update a-hash element add1 0))
           (hash)
           lst))

(define ht (scan A))

(define only-repeated
  (time
   (for/hash ([(k v) (in-hash ht)]
              #:when (< 1 v))
     (values k v))))

我添加了调用以time查看需要多长时间.对于一百万大小的列表,在我的计算机上,这需要1毫秒的测量时间.

渐近复杂度很重要!

1> John Clement..：

这非常容易修复.

事实上,如果这是你想要的,那么没有理由对它进行排序或将其转换为列表; 只是直接过滤哈希表.像这样...

#lang racket

(define A (build-list 1000000 (? (idx) (random 50))))

(define (scan lst)
    (foldl (lambda (element a-hash) (hash-update a-hash element add1 0))
           (hash)
           lst))

(define ht (scan A))

(define only-repeated
  (time
   (for/hash ([(k v) (in-hash ht)]
              #:when (< 1 v))
     (values k v))))

我添加了调用以time查看需要多长时间.对于一百万大小的列表,在我的计算机上,这需要1毫秒的测量时间.

渐近复杂度很重要!

推荐阅读

程序员
如何循环参数java？

如何解决《如何循环参数java？》经验，为你挑选了1个好方法。 ... [详细]
程序员
`pip install pyside`冻结在Linux上？

如何解决《`pipinstallpyside`冻结在Linux上？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python中的方法重载:更多重载

如何解决《Python中的方法重载:更多重载》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rails:为什么我的服务器将http重定向到https

如何解决《Rails:为什么我的服务器将http重定向到https》经验，为你挑选了1个好方法。 ... [详细]
程序员
在c ++中使用"this"关键字对性能有影响吗？

如何解决《在c++中使用"this"关键字对性能有影响吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
这个AngularJS工厂的例子究竟如何？有些疑惑

如何解决《这个AngularJS工厂的例子究竟如何？有些疑惑》经验，为你挑选了0个好方法。 ... [详细]
程序员
GOCR没有使用培训结果

如何解决《GOCR没有使用培训结果》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Xcode中调整UIStackView的子视图？

如何解决《如何在Xcode中调整UIStackView的子视图？》经验，为你挑选了0个好方法。 ... [详细]
程序员
可靠地将类型符号(ITypeSymbol)与Roslyn进行比较

如何解决《可靠地将类型符号(ITypeSymbol)与Roslyn进行比较》经验，为你挑选了0个好方法。 ... [详细]
程序员
什么是hadoop中的序列文件？

如何解决《什么是hadoop中的序列文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
需要有关Flask安全模块的密码散列算法的建议

如何解决《需要有关Flask安全模块的密码散列算法的建议》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何设置pep8 linter接受2个空格缩进？

如何解决《如何设置pep8linter接受2个空格缩进？》经验，为你挑选了0个好方法。 ... [详细]
程序员
过滤其值小于0的pandas数据帧行

如何解决《过滤其值小于0的pandas数据帧行》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Ansible中,是否可以根据剧本定义身份验证方法？

如何解决《在Ansible中,是否可以根据剧本定义身份验证方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用哈希表在球拍中排序更快

如何解决《使用哈希表在球拍中排序更快》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将QString乘以它自身重复n次？

如何解决《如何将QString乘以它自身重复n次？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python中使用pandas将csv文件附加到一个

如何解决《在python中使用pandas将csv文件附加到一个》经验，为你挑选了1个好方法。 ... [详细]
程序员
POEdit不会在HTML标记中提取字符串

如何解决《POEdit不会在HTML标记中提取字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
在flink中测量作业执行时间

如何解决《在flink中测量作业执行时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将删除函数传递给make_shared？

如何解决《如何将删除函数传递给make_shared？》经验，为你挑选了2个好方法。 ... [详细]

手机用户2402852387

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章