2024 一天掌握python爬蟲【基礎(chǔ)篇】 涵蓋 requests、beautifulsoup、selenium:
https://www.bilibili.com/video/BV1Ju4y1Y7k6/
主要text屬性和三個方法get_attribute(),get_property(),get_dom_attribute()
text屬性獲取元素的文本信息;
get_attribute(),get_property(),get_dom_attribute()三個方法都是獲取元素的屬性值
區(qū)別是property是DOM中的屬性,是JavaScript里的對象;
attribute是HTML標(biāo)簽上的屬性,
dom_attribute則只能是HTML標(biāo)簽規(guī)范定義的屬性(自定義的屬性獲取不到)。
我們一般開發(fā)用的是get_attribute()方法。
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
browser = webdriver.Chrome()
url = "http://www.java1234.com/"
browser.get(url)
time.sleep(2)
input = browser.find_element(By.ID, "time")
print(input.text)
print(input.get_attribute('id'))
print(input.get_property('id'))
print(input.get_dom_attribute('id'))
print(input.get_attribute('class'))
print(input.get_property('class'))
print(input.get_dom_attribute('class'))