我有一个包含XML文档的数据库,大致如此:
What is your name? ... What is your address?
我希望能够获取一个搜索词,然后返回一个明确的问题列表,其中找到该术语,例如使用上面的数据搜索"name",将返回一个结果,"你的名字是什么?".
我已经成功实现了这一点fn:distinct-values
,但显然效率不高.
我想用CTS实现这个.我尝试过以下方法:
for $question in cts:element-values( xs:QName('question'),(),(), cts:element-word-query(xs:QName("question"), "name")) return $question
然而,这会导致问题在问题文本中没有"名称".例如,在上面的例子中,返回了两个问题.我认为这是因为我正在使用的查询未经过滤传递,因此如果该片段存在匹配,它将从片段返回任何问题.
这个假设是否正确?
我能做些什么才能实现我想做的事 - 有效率?
谢谢!
那是对的; cts:element-values()
是一个词典类型的函数,所以它运行未经过滤.
最有效的方法是使用匹配的词典函数,如cts:element-value-match
:
cts:element-value-match(xs:QName('question'), "* name*")
问题在于,它直接使用范围索引进行匹配,这些匹配没有cts:search
基于查询的某些功能,如语言词干,但速度最快.因此,例如,要处理您可能想要匹配"名称"的所有情况,您可能必须构建更详细的查询集:
cts:element-value-match(xs:QName('question'), ("* name?", "name *", "* name *"))
如果通配符的限制不会给您的应用程序带来任何问题,那么在给定文档结构的情况下,这是查询这些值的最有效方法.
仍然使用cts:queries
并且可能足够快的一个折衷解决方案是在查询后过滤值:
for $v in cts:element-values(xs:QName('question'), (), (), cts:element-word-query(xs:QName('question'), 'name')) where cts:contains($v, cts:word-query('name')) return $v