主页

主页
分类
热文
教程
面试
标签

Beautiful Soup 教程

Beautiful Soup 首页

Beautiful Soup 概述

Beautiful Soup 网页抓取

Beautiful Soup 安装

Beautiful Soup 测试包

Beautiful Soup 对象类型

Beautiful Soup 检查数据源

Beautiful Soup 抓取 HTML 内容

Beautiful Soup 按标签导航

Beautiful Soup 按 ID 查找元素

Beautiful Soup 按类查找元素

Beautiful Soup 按属性查找元素

Beautiful Soup 寻找树

Beautiful Soup 修改树

Beautiful Soup 解析文档的某个部分

Beautiful Soup 找到一个元素的所有子项

Beautiful Soup 使用 CSS 选择器查找元素

Beautiful Soup 查找所有注释

Beautiful Soup 从 HTML 抓取列表

Beautiful Soup 从 HTML 中抓取段落

Beautiful Soup 从 HTML 中抓取链接

Beautiful Soup 获取所有 HTML 标签

Beautiful Soup 获取标签内的文本

Beautiful Soup 查找所有标题

Beautiful Soup 提取标题

Beautiful Soup 提取电子邮件地址

Beautiful Soup 嵌套标签

Beautiful Soup 解析HTML表格

Beautiful Soup 标签的层级结构

Beautiful Soup 搜索特定文本

Beautiful Soup 移除标签

Beautiful Soup 移除所有样式

Beautiful Soup 移除script标签

Beautiful Soup 移除空标签

Beautiful Soup 移除子元素

Beautiful Soup find()和find_all()比较

Beautiful Soup 指定解析器

Beautiful Soup 比较对象

Beautiful Soup 创建副本

Beautiful Soup Tag对象位置

Beautiful Soup 编码

Beautiful Soup 输出格式化

Beautiful Soup prettify()方法

Beautiful Soup NavigableString类

Beautiful Soup 象转换为字符串

Beautiful Soup HTML文档转文本

Beautiful Soup 解析XML文档

Beautiful Soup 错误处理

Beautiful Soup 故障排除

Beautiful Soup 移植旧代码

Beautiful Soup 函数参考

Beautiful Soup contents 属性

Beautiful Soup children 属性

Beautiful Soup string 属性

Beautiful Soup strings 属性

Beautiful Soup stripped_strings 属性

Beautiful Soup descendants 属性

Beautiful Soup parent 属性

Beautiful Soup parents 属性

Beautiful Soup next_sibling 属性

Beautiful Soup previous_sibling 属性

Beautiful Soup next_siblings 属性

Beautiful Soup previous_siblings 属性

Beautiful Soup next_element 属性

Beautiful Soup previous_element 属性

Beautiful Soup next_elements 属性

Beautiful Soup previous_elements 属性

Beautiful Soup find() 方法

Beautiful Soup find_all() 方法

Beautiful Soup find_parents() 方法

Beautiful Soup find_parent() 方法

Beautiful Soup find_next_siblings() 方法

Beautiful Soup find_next_sibling() 方法

Beautiful Soup find_previous_siblings() 方法

Beautiful Soup ind_previous_sibling() 方法

Beautiful Soup find_all_next() 方法

Beautiful Soup find_next() 方法

Beautiful Soup find_all_previous() 方法

Beautiful Soup find_previous() 方法

Beautiful Soup select() 方法

Beautiful Soup append() 方法

Beautiful Soup extend() 方法

Beautiful Soup NavigableString() 方法

Beautiful Soup new_tag() 方法

Beautiful Soup insert() 方法

Beautiful Soup insert_before() 方法

Beautiful Soup insert_after() 方法

Beautiful Soup clear() 方法

Beautiful Soup extract() 方法

Beautiful Soup ecompose() 方法

Beautiful Soup replace_with() 方法

Beautiful Soup wrap() 方法

Beautiful Soup unwrap() 方法

Beautiful Soup smooth() 方法

Beautiful Soup prettify() 方法

Beautiful Soup encode() 方法

Beautiful Soup decode() 方法

Beautiful Soup get_text() 方法

Beautiful Soup diagnose() 方法

教程

Beautiful Soup 首页

Beautiful Soup 概述

Beautiful Soup 网页抓取

Beautiful Soup 安装

Beautiful Soup 测试包

Beautiful Soup 对象类型

Beautiful Soup 检查数据源

Beautiful Soup 抓取 HTML 内容

Beautiful Soup 按标签导航

Beautiful Soup 按 ID 查找元素

Beautiful Soup 按类查找元素

Beautiful Soup 按属性查找元素

Beautiful Soup 寻找树

Beautiful Soup 修改树

Beautiful Soup 解析文档的某个部分

Beautiful Soup 找到一个元素的所有子项

Beautiful Soup 使用 CSS 选择器查找元素

Beautiful Soup 查找所有注释

Beautiful Soup 从 HTML 抓取列表

Beautiful Soup 从 HTML 中抓取段落

Beautiful Soup 从 HTML 中抓取链接

Beautiful Soup 获取所有 HTML 标签

Beautiful Soup 获取标签内的文本

Beautiful Soup 查找所有标题

Beautiful Soup 提取标题

Beautiful Soup 提取电子邮件地址

Beautiful Soup 嵌套标签

Beautiful Soup 解析HTML表格

Beautiful Soup 标签的层级结构

Beautiful Soup 搜索特定文本

Beautiful Soup 移除标签

Beautiful Soup 移除所有样式

Beautiful Soup 移除script标签

Beautiful Soup 移除空标签

Beautiful Soup 移除子元素

Beautiful Soup find()和find_all()比较

Beautiful Soup 指定解析器

Beautiful Soup 比较对象

Beautiful Soup 创建副本

Beautiful Soup Tag对象位置

Beautiful Soup 编码

Beautiful Soup 输出格式化

Beautiful Soup prettify()方法

Beautiful Soup NavigableString类

Beautiful Soup 象转换为字符串

Beautiful Soup HTML文档转文本

Beautiful Soup 解析XML文档

Beautiful Soup 错误处理

Beautiful Soup 故障排除

Beautiful Soup 移植旧代码

函数参考

Beautiful Soup contents 属性

Beautiful Soup children 属性

Beautiful Soup string 属性

Beautiful Soup strings 属性

Beautiful Soup stripped_strings 属性

Beautiful Soup descendants 属性

Beautiful Soup parent 属性

Beautiful Soup parents 属性

Beautiful Soup next_sibling 属性

Beautiful Soup previous_sibling 属性

Beautiful Soup next_siblings 属性

Beautiful Soup previous_siblings 属性

Beautiful Soup next_element 属性

Beautiful Soup previous_element 属性

Beautiful Soup next_elements 属性

Beautiful Soup previous_elements 属性

Beautiful Soup find() 方法

Beautiful Soup find_all() 方法

Beautiful Soup find_parents() 方法

Beautiful Soup find_parent() 方法

Beautiful Soup find_next_siblings() 方法

Beautiful Soup find_next_sibling() 方法

Beautiful Soup find_previous_siblings() 方法

Beautiful Soup ind_previous_sibling() 方法

Beautiful Soup find_all_next() 方法

Beautiful Soup find_next() 方法

Beautiful Soup find_all_previous() 方法

Beautiful Soup find_previous() 方法

Beautiful Soup select() 方法

Beautiful Soup append() 方法

Beautiful Soup extend() 方法

Beautiful Soup NavigableString() 方法

Beautiful Soup new_tag() 方法

Beautiful Soup insert() 方法

Beautiful Soup insert_before() 方法

Beautiful Soup insert_after() 方法

Beautiful Soup clear() 方法

Beautiful Soup extract() 方法

Beautiful Soup ecompose() 方法

Beautiful Soup replace_with() 方法

Beautiful Soup wrap() 方法

Beautiful Soup unwrap() 方法

Beautiful Soup smooth() 方法

Beautiful Soup prettify() 方法

Beautiful Soup encode() 方法

Beautiful Soup decode() 方法

Beautiful Soup get_text() 方法

Beautiful Soup diagnose() 方法

Beautiful Soup 检查数据源

为了使用BeautifulSoup和Python抓取网页，任何网页抓取项目的首要步骤应该是探索你想要抓取的网站。因此，在开始提取对你有用的信息之前，首先要访问该网站以了解其结构。

让我们访问Yoagoa的Python教程首页。在浏览器中打开https://yoagoa.com/course/python/。

使用开发者工具可以帮助你理解网站的结构。所有现代浏览器都预装了开发者工具。

如果你使用的是Chrome浏览器，可以从右上角的菜单按钮（?）中选择“更多工具”→“开发者工具”来打开开发者工具。

开发者工具

借助开发者工具，你可以探索网站的文档对象模型（DOM），以更好地理解你的来源。在开发者工具中选择“元素”标签。你会看到带有可点击HTML元素的结构。

该教程页面在左侧边栏显示了目录。右键点击任何章节并选择检查选项。

对于“元素”标签，定位到对应于目录列表的标签，右键点击HTML元素，复制该元素并在任何编辑器中粘贴。

此时，获得了<nav>..</nav>元素的HTML脚本。

我们现在可以在一个BeautifulSoup对象中加载这个脚本来解析文档树。

关注阅读号

联系我们

粤ICP备18007391号

站点地图