14赞

什么是SQL Like运算符的合适替代品以提高性能？

作者：小妖694_807 | 2023-09-01 14:50

如何解决《什么是SQLLike运算符的合适替代品以提高性能？》经验，为你挑选了1个好方法。

我正在开发一个在Windows Mobile 6上运行的应用程序,它需要能够从项目表格中检索包含给定字符串(由最终用户提供)的项目表中的所有项目.问题是表中大约有170,000个项目.由于我需要在描述中的任何位置返回包含字符串的所有项目,因此我不得不使用LIKE%string%,这样就无法使用索引.数据和表结构最初基于Progress数据库,它在任何单词索引字段上都有一个精彩的包含运算符.我们的移动应用程序不是这种情况,因为它使用的是SQL Server Compact 3.5.

基本上,我的DAL运行查询并检索SqlCeDataReader,然后使用ItemFactory创建仅包含匹配项的List对象.这显然可以让我们将域/业务对象与数据访问层分开.

精细和花花公子,除了在我搜索描述中包含类似"高尔夫"之类的所有项目时检索项目所需的8米和42秒.显然,这不是最终用户可接受的时间范围.

我的第一次尝试是使用SELECT*FROM Item"(在其中一个主索引字段上使用order by子句)从数据库中检索所有项目.此时,我在运行SqlCeDataReader时运行了IndexOf检查如果项目包含所请求的描述文本,则ItemFactory仅向List对象添加项目.这将速度提高到1m 46s.不是太破旧,但仍然太慢.

然后我尝试了另一种显示出承诺的方法......几乎......当应用程序启动时,我尝试创建一个包含数据库中所有项目对象的List(大约需要2分钟来运行查询并填充整个列表,但是至少它只是一次,因为应用程序正在初始化......仍然......呃).一旦列表完成,我可以轻松地在该列表上运行查询,执行以下操作(我希望我的语法正确...我现在不工作,我没有在PC上使用Visual Studio我坐在那里:

List specificItems = 
    AllItems.FindAll(i => i.Description.IndexOf(searchString, StringComparison.OrdinalIgnoreCase) >= 0);

这种方法将其降至21秒.非常好(虽然在宏伟的计划中仍然很慢).但是,问题是如果我从数据库加载所有项目,内存使用量太大了.在初始加载期间,我必须切断最后20,000个项目(所以21s时间框架可能更像是25s),因为抛出了OutOfMemoryException.根据模拟器上的内存管理器,我仍然有大约20 MB的空闲RAM,但我听说一个进程只能有32 MB或RAM相关联(不确定WM 6是否属实,但它出现了所以).

为了确保它不是因为我使用List对象来保存所有项目(我在构造函数中实例化了所需的容量以避免动态调整大小),我也读过它可能会导致额外的内存使用量implicity调用EnsureCapacity,我尝试使用Item []数组(提前调整大小).这仍然存在内存问题,尺寸差异可以忽略不计.

好吧漫无边际.我知道我可能会有一些如何限制datareader从数据库返回的记录(通过对不同类型字段的一些索引搜索),然后可能会在较小的项目子集上使用indexOf来获得最大性能(因此一起跳过Like运算符).这将导致最终用户不仅必须输入描述搜索(可能是项目层次结构信息以限制在其中搜索的项目类型).

有任何想法吗？我是以错误的方式来做这件事的吗？

谢谢你的聆听(对不起这篇文章很长,我有点大声思考).

哦,我应该添加(只是总结)我正在使用的东西:

Windows Mobile 6

Sql Server Compact Edition 3.5

C#3.5

更新:虽然下面提到的Bloom Filter方法看起来很有趣,但我无法满足一个要求(我上面没有真正说明).我无法真正匹配其他词语中包含的词语(例如"俱乐部"不会返回"俱乐部").因此,我被迫完全使用不同的方法(Kent Fredric ......感谢你指出这一点).我已经将Kent的答案标记为正确,因为他的方法是满足最多要求的(Mitch,你的问题与Jaunder建议的Bloom过滤器类似).但是,我采用了不同的方法(现在......),而不是他的方式.

我所做的是将所有项目对象拉入内存,只有项目编号和描述(这使其保持在内存限制之下,但它仍然会导致比我喜欢的更长的初始化...多线程并在后台加载该信息而应用程序正在运行可以照顾我猜).为了执行搜索,我编写了自己的包含例程.该例程使用非托管c#代码编写,该代码使用两个指针和几个循环来运行描述和所需的匹配文本.如果它在描述中的任何位置找到匹配项,则会将项目编号添加到数组中.搜索完所有项目后,新查询将返回到数据库并仅捕获匹配的项目编号(由于整数字段上的索引,该编号非常快).然后,这些项目在List中创建,包含所有信息(不仅仅是项目编号和描述).整个操作大约需要5-10秒(取决于描述),这对于现在来说已经足够了.

我仍然会考虑进一步优化它(可能能够跟踪搜索项的字符数...如果项目描述中剩余的字符少于所需的文本,则循环可以继续直接到下一个项目) .

任何建议仍然欢迎.现在我已将肯特的答案标记为我的问题"最正确".

向Dolch道具,帮助我编写包含例程.

1> Mitch Wheat..：

如何预处理(一次)items表(并且需要处理添加到它的每个新条目),以创建一个单词出现表

CREATE TABLE WordItemOccurance
(
    [Word] varchar(50) not null,

    ItemId int not null
        constraint FK_Items references ItemTable(ID)
)

迭代所有项目,分成单独的单词,并在找到它们时将条目添加到出现表中.

在[Word]上创建聚簇索引并加入ItemId上的Item表应该很快.

推荐阅读

程序员
来自PHP的mp4 - 不在HTML5视频标签中播放

如何解决《来自PHP的mp4-不在HTML5视频标签中播放》经验，为你挑选了0个好方法。 ... [详细]
程序员
在两个连续数组之间放置逗号

如何解决《在两个连续数组之间放置逗号》经验，为你挑选了1个好方法。 ... [详细]
程序员
其他进程中的PID错误

如何解决《其他进程中的PID错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
键入功能面向对象语言的系统

如何解决《键入功能面向对象语言的系统》经验，为你挑选了1个好方法。 ... [详细]
程序员
angular.js延迟在回调中不起作用

如何解决《angular.js延迟在回调中不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
将大型Excel/Csv文件拆分为PHP或Javascript上的多个文件

如何解决《将大型Excel/Csv文件拆分为PHP或Javascript上的多个文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
关联关系中的角色名称

如何解决《关联关系中的角色名称》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在ios地图中突出显示国家/地区

如何解决《如何在ios地图中突出显示国家/地区》经验，为你挑选了1个好方法。 ... [详细]
程序员
派生列中的SSIS日期为yyyy-mm-dd格式

如何解决《派生列中的SSIS日期为yyyy-mm-dd格式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用puppet为不同的用户设置自定义bash环境？

如何解决《如何使用puppet为不同的用户设置自定义bash环境？》经验，为你挑选了0个好方法。 ... [详细]
程序员
循环无限循环(2.7)

如何解决《循环无限循环(2.7)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将URL：PORT指向apache中的特定目录

如何解决《如何将URL：PORT指向apache中的特定目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
保留视图之间上载的文件

如何解决《保留视图之间上载的文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
在JellyBean中没有调用onNewIntent

如何解决《在JellyBean中没有调用onNewIntent》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Codeigniter中使用页眉和页脚的最佳方法

如何解决《在Codeigniter中使用页眉和页脚的最佳方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android会在键入时自动将EditText的内容移动到下一行

如何解决《Android会在键入时自动将EditText的内容移动到下一行》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Excel 2010 Powerpivot Addin中为SQL Server 2008 R2中的每个连接表键入密码

如何解决《在Excel2010PowerpivotAddin中为SQLServer2008R2中的每个连接表键入密码》经验，为你挑选了0个好方法。 ... [详细]
程序员
是否可以删除列表列表中的项目而不会丢失原始引用？

如何解决《是否可以删除列表列表中的项目而不会丢失原始引用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从td标签BeautifulSoup Python获取href属性链接

如何解决《从td标签BeautifulSoupPython获取href属性链接》经验，为你挑选了1个好方法。 ... [详细]
程序员
按日期按日期在php中按日期排序数组

如何解决《按日期按日期在php中按日期排序数组》经验，为你挑选了1个好方法。 ... [详细]

小妖694_807

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章