昨天介绍了使用onenote截图的方式突破文件保护实现收集、编辑网络文本的目的。其实还有另外一个思路也可以达到同样的结果。
即采取先打印页面到onenote,然后再识别的办法。(注意:onenote安装之后会自动在系统的打印机里生成一台虚拟打印机)
具体实例:
1、以下页面的文字内容是无法进行复制、剪切等操作的(网页链接是http://old.sinosafe.com.cn/huaan/yuekan/readns.jsp?newsid=989)
2、使用浏览器的打印功能,在选择打印机时选择“发送至onenote2007”。
3、在进行了以上操作之后,会在onenote里显示打印的材料,这时点鼠标右键单击弹出的对话框中有“复制所有打印输出页的文本”,点击它即可实现ocr文字识别的功能。
4、将文本粘贴出来,识别率很高,稍加编辑即可使用。
|