很多时候我们需要对一些大文本进行处理,比如查找、替换等等然而,在更多时候对于我们要替换的对象只有若幹印象描述,比如知道它前面是什么鬼后面是什么鬼,或者自己是由某些字母组成不能精确地把它拼写出来,这时就要用到正则表達式。
我们看保研论坛夏令营2016理科汇总贴。
我们想找到所有数学专业同学能报的夏令营借助网站自带的find功能,略显分散每一都要一個一个看,不利于保存之余手机上也不能看。
这时我想用txt将所有数学专业同学能报的夏令营包括它的链接保存下来。不用python这次改用notepad++嘚录制宏功能。
- 右键点击网页另存为。
- 用natepad++打开保存下来的网页我们看看这个凌乱的源代码。
- ctrl+F打开搜索界面选择“标记”标签页。打勾“正则表达式“、”标记所在行“、“清除上次标记”
-
搜索-书签-删除未标记行。
我们可以录制成宏以便下次内容更新后,点击直接苼成;保存后用记事本打开有可能空格和换行没了只要在notepad++中双击修改状态栏中的某一项就行了,比如说unix转换为windows格式