9赞

如何使用BeautifulSoup从HTML"datacell"获取文本

作者：Chloemw | 2023-09-03 18:22

如何解决《如何使用BeautifulSoup从HTML"datacell"获取文本》经验，为你挑选了1个好方法。

我一直试图从HTML文件中删除一些数据.我有逻辑编码来获得正确的单元格.现在我正在努力获得'细胞'的实际内容:

这是我的htm剪辑

那么headerRows [0] [10] .contents

  [Apples Produced       
  ]

请注意,这是Python []中的列表项.

我需要Apples Produced的价值,但无法达到它.

任何建议,将不胜感激

关于解释这一点的好书的建议将获得我永恒的感激之情

谢谢你的回答.然而,没有更普遍的答案.如果我的单元格没有粗体属性会发生什么

说它是:

 [Apples Produced       
  ]

苹果生产

我正在努力学习阅读/理解文档,您的回复将有所帮助

我非常感谢这个帮助.关于这些答案的最好的事情是,从它们推广起来要容易得多,然后我就可以从BeautifulSoup文档中做到这一点.我学会了在Fortran时代进行编程,而我正在享受学习python并且对它的能力感到惊讶 - BeautifulSoup就是一个例子.制作一个cohernet整个文档对我来说很难.

干杯

1> Jonny Buchan..：

该BeautifulSoup文件应包括你需要的一切-在这种情况下,它看起来像你想使用findNext:

headerRows[0][10].findNext('b').string

不依赖于标记的更通用的解决方案是使用text参数findAll,它允许您仅搜索NavigableString对象:

>>> s = BeautifulSoup(u'
Test 1 More Test 2
') >>> u''.join([s.string for s in s.findAll(text=True)]) u'Test 1 More Test 2'

推荐阅读

程序员
管道多部分表单上传到另一台服务器

如何解决《管道多部分表单上传到另一台服务器》经验，为你挑选了0个好方法。 ... [详细]

程序员
在设置Android应用程序的区域设置后,SharedPrefs正在重置

如何解决《在设置Android应用程序的区域设置后,SharedPrefs正在重置》经验，为你挑选了0个好方法。 ... [详细]

程序员
如何将输出变为连续字符串而不是将其堆叠在每个字母的顶部 - c#

如何解决《如何将输出变为连续字符串而不是将其堆叠在每个字母的顶部-c#》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何将数组拆分成组

如何解决《如何将数组拆分成组》经验，为你挑选了0个好方法。 ... [详细]

程序员
Worksheet_change:删除整列值,在此操作之前标识非空单元格

如何解决《Worksheet_change:删除整列值,在此操作之前标识非空单元格》经验，为你挑选了0个好方法。 ... [详细]

程序员
从数据透视表中查找一行

如何解决《从数据透视表中查找一行》经验，为你挑选了0个好方法。 ... [详细]

程序员
每次在ng-repeat上添加一个内联值

如何解决《每次在ng-repeat上添加一个内联值》经验，为你挑选了1个好方法。 ... [详细]

程序员
我的wp-admin并没有工作

如何解决《我的wp-admin并没有工作》经验，为你挑选了0个好方法。 ... [详细]

程序员
如何使用boost :: variant以"二维方式"定义异构std :: map

如何解决《如何使用boost::variant以"二维方式"定义异构std::map》经验，为你挑选了0个好方法。 ... [详细]

程序员
Oracle Apex:PL/SQL块中的Javascript代码

如何解决《OracleApex:PL/SQL块中的Javascript代码》经验，为你挑选了0个好方法。 ... [详细]

程序员
在支持设计库中找不到android.support.design.widget.Snackbar

如何解决《在支持设计库中找不到android.support.design.widget.Snackbar》经验，为你挑选了3个好方法。 ... [详细]

程序员
在Rstudio中运行python/bash代码

如何解决《在Rstudio中运行python/bash代码》经验，为你挑选了0个好方法。 ... [详细]

程序员
MPAndroidChart未更新

如何解决《MPAndroidChart未更新》经验，为你挑选了1个好方法。 ... [详细]

程序员
为什么Scala不允许在不使用"new"运算符的情况下实例化类？

如何解决《为什么Scala不允许在不使用"new"运算符的情况下实例化类？》经验，为你挑选了1个好方法。 ... [详细]

程序员
确定Java注释处理器中类型的稳定性

如何解决《确定Java注释处理器中类型的稳定性》经验，为你挑选了0个好方法。 ... [详细]

程序员
整个会话下载进度Alamofire

如何解决《整个会话下载进度Alamofire》经验，为你挑选了0个好方法。 ... [详细]

程序员
为什么我的Perl循环变量是本地的,即使不使用`my`？

如何解决《为什么我的Perl循环变量是本地的,即使不使用`my`？》经验，为你挑选了1个好方法。 ... [详细]

程序员
IOS模拟器:模拟器用户已请求新的图形质量:100

如何解决《IOS模拟器:模拟器用户已请求新的图形质量:100》经验，为你挑选了1个好方法。 ... [详细]

程序员
如何使用angularjs注销后清除本地存储

如何解决《如何使用angularjs注销后清除本地存储》经验，为你挑选了1个好方法。 ... [详细]

程序员
C和OOP需要一点澄清

如何解决《C和OOP需要一点澄清》经验，为你挑选了1个好方法。 ... [详细]

吐了个 "CAO" !

吐个槽吧,看都看了

会员登录 | 用户注册

Chloemw

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

actionscrip

bash

c#

c++

c语言

erlang

flutter

go

golang

java

javascript

lua

node.js

perl

php

python

scala

typescript

RankList | 热门文章

1如何使用Selenium2Library查找电子邮件字段的值

2Swift中的多线程函数式编程

3未解决的参考文献:kotlinx

4为什么我们需要std :: promise和std :: future？

5Chrome中的Azure无限重定向循环

6在git bash中设置一个环境变量

7正则表达式不包括666和900-999

8OData WebApi 2错误处理

9plot.roc用于pROC包中的multiclass.roc？

10在TestFlight(iTunes Connect)中为外部测试人员提交应用程序时出错

11有没有人让Google Play的"跟踪渠道(UTM)"广告系列跟踪工作？

12使用Java中的Bouncy Castle创建具有主题备选方案的PKCS10请求

13SQLAlchemy:创建query.from_statement(text(...))的子查询,引发AttributeError

14从弹性搜索中删除或删除旧数据

15如何在chrome扩展开发中获取选定的文本？

16使用Optional Java 8避免在List处理中进行"空检查"

17为什么我的Arduino类构造函数需要参数？

18二进制搜索树的析构函数

19Service Fabric Reliable Collections:序列化问题

20R中的多项式回归 - 对曲线有额外的约束