如何统计html标签的数目 python
1、准备一个要统计的html文件,将其与py代码放在同一目录中
2、编写代码:import rewith open('index.html争犸禀淫','r',encoding='utf-8') as f多唉捋胝: htmlstr = f.read() # 打开html文件,并将内容放入htmstr变量elements_lists = re.findall('<[^/].*?>',htmlstr) # 利用正则表达式,查找所有不是以/开头的<>print(len(elements_lists)) # 打印其长度print(len(list(set(elements_lists)))) # 去重后打印长度
3、上述代码的缺点是:如果正文中有<内容>这样的情况,那也会一并被统计。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:95
阅读量:21
阅读量:58
阅读量:71
阅读量:43