一、方法描述
在同一缩进级别出现的 HTML 标签称为兄弟标签。PageElement 的 next_sibling
属性返回在同一层级或同一父元素下的下一个标签。
二、语法
element.next_sibling
三、返回类型
next_sibling
属性返回一个 PageElement,可以是 Tag 或者 NavigableString 对象。
四、示例
示例 1
index.html
页面包含一个带有三个输入元素的 HTML 表单,每个输入元素都有一个 name 属性。在下面的例子中,定位了一个具有 name 属性为 nm
的输入标签的下一个兄弟元素。
from bs4 import BeautifulSoup
fp = open("index.html")
soup = BeautifulSoup(fp, 'html.parser')
tag = soup.find('input', {'name':'age'})
print(tag.find_previous())
fp = open("index.html")
soup = BeautifulSoup(fp, 'html.parser')
tag = soup.find('input', {'id':'nm'})
sib = tag.next_sibling
print(sib)
输出:
<input id="nm" name="name" type="text"/>
示例 2
在下一个例子中,我们有一个包含几个标签的 <p>
标签内的 HTML 文档。next_sibling
属性返回紧邻 <b>
标签的下一个标签。
from bs4 import BeautifulSoup
soup = BeautifulSoup("<p><b>Hello</b><i>Python</i></p>", 'html.parser')
tag1 = soup.b
print("next:", tag1.next_sibling)
输出:
next: <i>Python</i>
示例 3
考虑下面文档中的 HTML 字符串。它有两个同级的 <p>
标签。第一个 <p>
的 next_sibling
应该给出第二个 <p>
标签的内容。
html = '''
<p><b>Hello</b><i>Python</i></p>
<p>Yoagoa</p>
'''
soup = BeautifulSoup(html, 'html.parser')
tag1 = soup.p
print("next:", tag1.next_sibling)
输出:
next:
在 next:
后面的空白行是意料之外的。但这是因为第一个 <p>
标签后面的 \n
字符造成的。修改打印语句如下所示来获取 next_sibling
的内容:
tag1 = soup.p
print("next:", tag1.next_sibling.next_sibling)
输出:
next: <p>Yoagoa</p>