我昨天问了一个问题如何使用XML :: Simple检索标记属性?链接我用来获取XML:
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=pubmed&id=19273512(1)
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=pubmed&id=19291509(2)
我取得了很好的进展并编写了以下代码,循环遍历标签并搜索我需要的代码.我在'ArticleIds'下寻找'doi'标签
foreach $item_node (@{$dataSummary->{DocSum}->{Item}}) { if($item_node->{Name} eq 'ArticleIds') { foreach $item_node1 (@{$item_node->{Item}}) { if ($item_node1->{Name} eq 'doi') { $doi= $item_node1->{content}; last; } } last; } }
此代码基本上搜索ArticleIds标记,然后搜索其下的子标记以查找"doi"标记.
我遇到的问题是当ArticleIds下有多个子标签时(如(2)所示)那么一切正常.但是,当ArticleIds标签下只有一个子标签时(如(1)所示),则存在错误,程序就会停止.
我正在使用Simple Parser并使用翻斗车我得到了两个结果.这是链接转储的一部分(1)
{ 'Type' => 'List', 'Item' => { 'Type' => 'String', 'content' => '19273512', 'Name' => 'pubmed' }, 'Name' => 'ArticleIds' }
用于链接(2)
{ 'Type' => 'List', 'Item' => [ { 'Type' => 'String', 'content' => '909564644', 'Name' => 'pii' }, { 'Type' => 'String', 'content' => '10.1080/13506120802676914', 'Name' => 'doi' }, { 'Type' => 'String', 'content' => '19291509', 'Name' => 'pubmed' } ], 'Name' => 'ArticleIds' }
如你看到的.当ArticleIds下有多个标签时,它被视为一个数组,因此方括号.
在这种情况下,有人会建议什么?
如果文件只有一个Item
元素,则该项将显示在哈希中.如果有多个Item
元素,那么它将显示为数组.您可以使用该ForceArray
选项强制某些标记始终包含列表.将它想要强制的所有属性名称的正则表达式传递给数组,然后它将处理其余的.
XMLin( 'file.xml', ForceArray => qr{Item}x );
哦,还要检查你正在使用的XML :: Simple版本.我认为早期版本只能使用ForceArray指定值的数组ref,或者它根本不起作用.如果它只适用于arrayref,您可以使用以下命令指定它:
XMLin( 'file.xml', ForceArray => [ 'Item' ] );
查看XML :: Simple CPAN文档以查看可能对您有所帮助的更多选项.
就版本而言,如果你使用的是XML :: Simple,比如ActiveState发行版,它很可能已经过时了.尝试抓住一个更新的.
你也可以检查它是什么类型,使用
$item =~ /HASH/ # hash $item =~ /ARRAY/ # array
或ref关键字(如您所发现的)
ref($item) eq 'HASH' ref($item) eq 'ARRAY'