字符串的常见的操作有
切片:split()
split(str="", num=string.count(str))对字符串进行切片,str:指定分隔符,num:分割成num+1片,默认为-1即分割所有;
替换:replace()
str.replace(old, new[, max]),把字符串中的 old(旧字符串) 替换成 new(新字符串),如果指定第三个参数max,则替换不超过 max 次;
需求:要获取某个页面内的某个固定字符串
import re
import requests
from bs4 import BeautifulSoup
def parse_url(url):
response = requests.get(url)
htm_page = BeautifulSoup(response.text, "html.parser", from_encoding="utf-8")
spqn_page = htm_page.find('span', class_="text-muted").text
print(spqn_page)
# split(str="", num=string.count(str))对字符串进行切片,str:指定分隔符,num:分割成num+1片,默认为-1即分割所有
# re模块分割含有多种分割符的字符串
split = re.split("[/页]", spqn_page)
print('split1:', split)
# 指定字符串的位置数,但缺点是字数增加字符的位置便改变,只适合固定长度的字符串
print('spqn_page.text[]:', spqn_page[8:10])
# str.replace(old, new[, max]),把字符串中的 old(旧字符串) 替换成 new(新字符串),如果指定第三个参数max,则替换不超过 max 次
print('split2:', split[2].replace(" ", ""))# 把空格替换调
if __name__ == '__main__':
url = 'https://avd.aliyun.com/high-risk/list?page=12'
parse_url(url)
exit(5)