纯文本压缩算法的当前状态是什么？

作者：贴进你的心聆听你的世界 | 2023-09-03 16:19

如何解决《纯文本压缩算法的当前状态是什么？》经验，为你挑选了2个好方法。

为了纪念Hutter奖,文本压缩的顶级算法(以及每个算法的快速描述)是什么？

注意:这个问题的目的是获得压缩算法的描述,而不是压缩程序的描述.

1> Corbin March..：

边界推动压缩机结合了疯狂结果的算法.常用算法包括:

在Burrows-Wheeler变换和此处 -洗牌字符(或其他比特块)与可预测的算法,以增加重复块这使得源更容易压缩.解压缩正常发生,结果与反向变换无混淆.注意:仅BWT实际上并不压缩任何东西.它只是使源更容易压缩.

部分匹配预测(PPM) - 算术编码的演变,其中预测模型(上下文)是通过处理源的统计信息与使用静态概率来创建的.尽管它的根源是算术编码,但结果可以用霍夫曼编码或字典以及算术编码来表示.

上下文混合 - 算术编码使用静态上下文进行预测,PPM动态选择单个上下文,上下文混合使用许多上下文并权衡其结果.PAQ使用上下文混合.这是一个高级概述.

动态马尔可夫压缩 - 与PPM相关但使用位级上下文与字节或更长时间.

此外,Hutter奖项参赛者可以用来自外部词典的小字节条目替换普通文本,并使用特殊符号区分大小写文本,而不是使用两个不同的条目.这就是为什么他们擅长压缩文本(特别是ASCII文本)而不是一般压缩的价值.

Maximum Compression是一个非常酷的文本和通用压缩基准站点.Matt Mahoney发布了另一个基准.Mahoney可能特别感兴趣,因为它列出了每个条目使用的主要算法.

2> Sören Kuklau..：

总是有lzip。

除了开玩笑：

在考虑兼容性的情况下，PKZIP（DEFLATE算法）仍然是赢家。

bzip2是享受相对广泛的安装基础和相当不错的压缩率之间的最佳折衷方案，但是需要单独的存档器。

7-Zip（LZMA算法）压缩效果非常好，可用于LGPL。但是，很少有带有内置支持的操作系统。

rzip是bzip2的变体，我认为值得更多关注。对于需要长期归档的大型日志文件而言，这可能特别有趣。它还需要一个单独的存档器。

这些都离PAQ和其他几种纯文本压缩算法（http://en.wikipedia.org/wiki/PAQ）不远

推荐阅读

程序员
具有max函数的std :: stack <int>？

如何解决《具有max函数的std::stack<int>？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Typescript React中遍历Component的Children？

如何解决《如何在TypescriptReact中遍历Component的Children？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何将@Configuration和@EnableScheduling与Spring Batch一起使用

如何解决《如何将@Configuration和@EnableScheduling与SpringBatch一起使用》经验，为你挑选了0个好方法。 ... [详细]
程序员
anaconda - windows中的路径环境变量

如何解决《anaconda-windows中的路径环境变量》经验，为你挑选了4个好方法。 ... [详细]
程序员
Haskell的逆向性:从Tardis到RevState

如何解决《Haskell的逆向性:从Tardis到RevState》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用GitPython检查合并是否存在冲突

如何解决《使用GitPython检查合并是否存在冲突》经验，为你挑选了1个好方法。 ... [详细]
程序员
预定的WebJob

如何解决《预定的WebJob》经验，为你挑选了2个好方法。 ... [详细]
程序员
我们怎么知道Activity共享元素转换将会运行？

如何解决《我们怎么知道Activity共享元素转换将会运行？》经验，为你挑选了0个好方法。 ... [详细]
程序员
python中的默认舍入模式,以及如何将其指定为另一个？

如何解决《python中的默认舍入模式,以及如何将其指定为另一个？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何创建一个"外部模块"打字稿定义文件以包含一个npm包？

如何解决《如何创建一个"外部模块"打字稿定义文件以包含一个npm包？》经验，为你挑选了0个好方法。 ... [详细]
程序员
鼠标悬停在轴标签d3.js javascript上的事件

如何解决《鼠标悬停在轴标签d3.jsjavascript上的事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
java中的GUI问题

如何解决《java中的GUI问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
cout << std :: ios :: hex有什么作用？

如何解决《cout<<std::ios::hex有什么作用？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Android Studio Start Failed:初始化'com.intellij.util.net.ssl.certificatemanager'时出现致命错误

如何解决《AndroidStudioStartFailed:初始化'com.intellij.util.net.ssl.certificatemanager'时出现致命错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否存在与Perforce的"文件同步到先前版本"图标的Tortoise SVN模拟

如何解决《是否存在与Perforce的"文件同步到先前版本"图标的TortoiseSVN模拟》经验，为你挑选了1个好方法。 ... [详细]
程序员
交叉表故障("返回和sql元组描述不兼容")

如何解决《交叉表故障("返回和sql元组描述不兼容")》经验，为你挑选了1个好方法。 ... [详细]
程序员
用变量base在python中向上计数

如何解决《用变量base在python中向上计数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Jersey StreamingOutput上调用flush()没有任何效果

如何解决《在JerseyStreamingOutput上调用flush()没有任何效果》经验，为你挑选了0个好方法。 ... [详细]
程序员
C#在JSON中搜索而不反序列化

如何解决《C#在JSON中搜索而不反序列化》经验，为你挑选了1个好方法。 ... [详细]
程序员
NSNotification子类与Swift 2.1中的Generics

如何解决《NSNotification子类与Swift2.1中的Generics》经验，为你挑选了1个好方法。 ... [详细]

贴进你的心聆听你的世界

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章