3赞

理解Beautiful Soup中的Find()函数

作者：oDavid_仔o_880 | 2023-09-10 09:32

如何解决《理解BeautifulSoup中的Find()函数》经验，为你挑选了1个好方法。

我知道我想做的事情很简单,但却让我感到悲痛.我想使用BeautifulSoup从HTML中提取数据.为此,我需要正确使用该.find()功能.这是我正在使用的HTML:



    
        
        Ed Boon
        @noobde
    

        
            
            
                73,599 Real

                32,452 Fake

                Followers
            
        
        
            
            
                69%
            
            Audit score

我想要的价值73599来自data-value=73599,32352来自data-value=32452和69%来自percentage good.

使用过去的代码和在线示例,这是我到目前为止:

RealValue = soup.find("div", {"class":"real number"})['data-value']
FakeValue = soup.find("audit", {"class":"fake number"})['data-value']

到目前为止两者都没有效果.我不确定如何制作这个发现以便提取69%数字.

1> alecxe..：

soup.find("div", {"class":"real number"})['data-value']

在这里,您要搜索一个div元素,但span在示例HTML数据中包含"实数"类,请尝试:

soup.find("span", {"class": "real number", "data-value": True})['data-value']

在这里,我们还检查data-value属性的存在.

要查找具有"实数"或"假数"类的元素,您可以创建一个CSS选择器:

for elm in soup.select(".real.number,.fake.number"):
    print(elm.get("data-value"))

要获得69%价值:

soup.find("div", {"class": "percentage good"}).get_text(strip=True)

或者,CSS选择器:

soup.select_one(".percentage.good").get_text(strip=True)
soup.select_one(".score .percentage").get_text(strip=True)

或者,找到h6具有Audit score文本的元素,然后获取前面的兄弟:

soup.find("h6", text="Audit score").previous_sibling.get_text(strip=True)

推荐阅读

程序员
如何使用别名调用特征方法

如何解决《如何使用别名调用特征方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何确定一个点是否高于或低于连接R点的线？

如何解决《如何确定一个点是否高于或低于连接R点的线？》经验，为你挑选了1个好方法。 ... [详细]
程序员
最终清空{}有什么用吗？

如何解决《最终清空{}有什么用吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么从bitcode重新编译使我无法在Xcode临时版本中进行符号化,如何解决？

如何解决《为什么从bitcode重新编译使我无法在Xcode临时版本中进行符号化,如何解决？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何围绕下一个偶数？

如何解决《如何围绕下一个偶数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
python:使用PyCharm和PyQt5时,进程以退出代码1结束

如何解决《python:使用PyCharm和PyQt5时,进程以退出代码1结束》经验，为你挑选了1个好方法。 ... [详细]
程序员
F#:哪个内存区域是存储的延续:堆栈还是堆？

如何解决《F#:哪个内存区域是存储的延续:堆栈还是堆？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将__builtin_expect委托给内联函数是否安全？

如何解决《将__builtin_expect委托给内联函数是否安全？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular 2服务未注入组件

如何解决《Angular2服务未注入组件》经验，为你挑选了2个好方法。 ... [详细]
程序员
在R中创建双模频率矩阵

如何解决《在R中创建双模频率矩阵》经验，为你挑选了1个好方法。 ... [详细]
程序员
spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

如何解决《spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌》经验，为你挑选了1个好方法。 ... [详细]
程序员
提升精神(X3)符号表,产生UTF8字符串

如何解决《提升精神(X3)符号表,产生UTF8字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用带有<router-outlet>的@Inputs的Angular2

如何解决《使用带有<router-outlet>的@Inputs的Angular2》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在MVC 6中存根/模拟AuthenticationManager？

如何解决《如何在MVC6中存根/模拟AuthenticationManager？》经验，为你挑选了1个好方法。 ... [详细]
程序员
OSX上的WebView与WKWebView

如何解决《OSX上的WebView与WKWebView》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android - 我的ListPreference中的自定义行布局

如何解决《Android-我的ListPreference中的自定义行布局》经验，为你挑选了0个好方法。 ... [详细]
程序员
什么是Vec <_>？

如何解决《什么是Vec<_>？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Object.assign未按预期工作

如何解决《Object.assign未按预期工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在plantUML中为UML项目使用自定义图像？

如何解决《是否可以在plantUML中为UML项目使用自定义图像？》经验，为你挑选了2个好方法。 ... [详细]
程序员
将字符串列表修改为只有最大n长度字符串(使用Linq)

如何解决《将字符串列表修改为只有最大n长度字符串(使用Linq)》经验，为你挑选了1个好方法。 ... [详细]

oDavid_仔o_880

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章