python regexp

Simplest case -


import re
regexp = re.compile('hello')
count = 0
file = open('j.txt','r')
for line in file.readlines() :
	if regexp.search(line) :
		count = count + 1
file.close()
print(count)


Now, if you want to use wildcard pattern.


import re
regexp = re.compile('(h|H)ello')
count = 0
file = open('j.txt','r')
for line in file.readlines() :
	if regexp.search(line) :
		count = count + 1
file.close()
print(count)

If you want to search '\ten', you need use raw strings in pattern.  

regexp = re.complie('\\ten')

In this way, you have escape '\' . Other char - \t (tab) \n (a new line) ...

>>> r"Hello" == "Hello" True

>>> r"\the"  == "\\the" True

>>> r"\the" == "\the" False



Hai Liang Wang 深度学习 算法 自然语言处理
Chatopera 联合创始人 & CEO,运营聊天机器人平台 https://bot.chatopera.com,让聊天机器人上线!2012年开始从事业务流程云,业务流程引擎开发,2015年开始探索聊天机器人的商业应用,实现基于自然语言交互的流程引擎、语音识别、自然语言理解,2018年出版《智能问答与深度学习》一书。
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值