当前位置:  开发笔记 > 前端 > 正文

rvest:如何查找HTML页面中使用的所有类?

如何解决《rvest:如何查找HTML页面中使用的所有类?》经验,为你挑选了1个好方法。



1> A5C1D2H2I1M1..:

将@ hadley的注释转换为CW答案,您可以使用*通配符获取所有类的向量.

因此,该方法看起来像:

page <- read_html(doc_url)

page %>% 
  html_nodes("*") %>% 
  html_attr("class") %>% 
  unique()
#  [1] NA                          "component"                 "waitBlock"
#  [4] "waitBlockContainer"        "toggle_img"                "btn_impression"
#  [7] "document_language"         "outputEcli"                "C19Centre"
# [10] "C71Indicateur"             "C02AlineaAltA"             "C72Alineadroite"
# [13] "C75Debutdesmotifs"         "C01PointnumeroteAltN"      "C04Titre1"
# [16] "C03Tiretlong"              "C05Titre2"                 "C06Titre3"
# [19] "C07Titre4"                 "C48DispositifIntroduction" "C08Dispositif"
# [22] "C77Signatures"             "C49FootnoteLangue"

推荐阅读
无名有名我无名_593
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有