谈一谈OCR文字识别 (www.ipcpu.com)

【简介】

OCR的难点主要是识别率:不仅要识别印刷的书本、现在更多的需求是识别照片中的文字,这些文字可能是印刷体也可能是手写体,甚至因为拍摄角度原因存在拉伸、模糊等各种变形的情况。

点击查看原文 >>

@技术头条 2021-05-26 23:09 / 0个评论
赞过的人: @IT技术博客大学习
要不要再学学下面的文章?
JA 指纹识别全系讲解 (paper.seebug.org)
近期在学习 Burp Suite 的反制时发现 Wfox 前辈写的反制爬虫之 Burp Suite RCE一文,文末处介绍了使用 JA3 指纹识别 Burp Suite 流量的方法,简单研究后发现实战中易用性较强,故借此机会完整介绍一下 JA 指纹的全系列,并拓展到实践中。
by @技术头条 2024-03-21 22:56 查看详情
前端原生API实现条形码二维码的JS解析识别 (www.zhangxinxu.com)
今天才知道,原来浏览器有原生的API,可以对二维码、条形码进行解析,使用非常简单!
by @技术头条 2023-01-10 00:07 查看详情
论文分享|基于被动DNS流量分析的大规模IoT设备识别系统 (blog.nsfocus.net)
如何通过被动流量识别IoT设备?如何检测分配了IPv6地址、NAT后的IoT设备?本文介绍了IoTFinder系统有效解决上述问题。
by @技术头条 2023-01-04 23:42 查看详情
文字语义纠错技术探索与实践-张健 (www.52nlp.cn)
文本语义纠错的使用场景非常广泛,基本上只要涉及到写作就有文本纠错的需求。书籍面市前就有独立的校对的环节来保障出版之后不出现明显的问题。在新闻中我们也时不时看到因为文字审核没到位造成大乌龙的情况,包括上市公司在公开文书上把“临时大会”写成为“临死大会”,政府文件把“报效国家”写成了“报销国家”。有关文本纠错的辅助工具能给文字工作人员带来较大的便利,对审核方面的风险也大幅降低。
by @技术头条 2022-12-24 23:38 查看详情
OCR技术发展综述与达观数据的实践经验 (www.52nlp.cn)
光学字符识别OCR技术(Optical Character Recognition)是指从图像中自动提取文字信息的技术。这项技术横跨了人工智能里的两大领域:CV(计算机视觉)和NLP(自然语言处理),综合使用了这两大领域中的很多技术成果。

在过往40余年的技术发展历程中,OCR始终具备很强的产业应用背景,是计算机领域里少数几个一开始就由工业界和学术界双轮驱动的领域。近年来OCR技术已经在工业界成熟落地应用,学术界里对此的研究热度反而弱于其他方向。甚至有人认为OCR技术已经充分成熟,没有更多研究必要了。然而随着近年来智能文本处理IDP(Intelligent Document Processing)在工业界的逐步落地应用,OCR和IDP相结合的应用场景越来越多,用语义理解NLP的角度进一步去延伸OCR的应用,出现了很多更有产业应用价值的场景。本文回顾了OCR技术的发展历程,并结合达观数据在工程实践方面的经验,介绍与语义分析技术结合后,当前OCR技术的一些最新发展和落地经验。
by @技术头条 2022-12-10 22:41 查看详情
基于文字的URL锚点定位与::target-text样式设置 (www.zhangxinxu.com)

文字选区片段高亮又新增一名成员,可以使用 ::target-text 伪元素进行匹配,反正耽误不了几分钟,过来看看,说不定之后用得着。
by @技术头条 2022-08-18 23:39 查看详情
洋葱式信息安全观察:浅议虚假信息识别 (www.sec-un.org)
虚假信息对经济、政治等有着重大影响,因此研究威胁信息检测的重要性也凸显出来,尤其是在这个全球“抗疫”的时期。虚假信息的检测方法和技术很多,本文仅进行了部分介绍。需要注意的是,数据集对虚假信息检测的准确性也有很大影响,需要我们重点关注。
互联网时代检测虚假信息虽然很棘手,但事实证明通过大量的知识积累,我们仍然可以在检测虚假信息的工作上取得良好效果。
by @技术头条 2022-06-19 23:19 查看详情
使用CSS size-adjust和unicode-range改变任意文字尺寸 (www.zhangxinxu.com)

介绍一个无需HTML标签就能控制任意字符字号大小的CSS技术,关键时候说不定可以救命,都来学学吧。
by @技术头条 2022-06-19 22:31 查看详情
使用 DeepSpeech 在你的应用中实现语音转文字 (linux.cn)
应用中的语音识别不仅仅是一个有趣的技巧,而且是一个重要的无障碍功能。

计算机的主要功能之一是解析数据。有些数据比其他数据更容易解析,而语音输入仍然是一项进展中的工作。不过,近年来该领域已经有了许多改进,其中之一就是 DeepSpeech,这是 Mozilla 的一个项目,Mozilla 是维护 Firefox 浏览器的基金会。DeepSpeech 是一个语音到文本的命令和库,使其对需要将语音输入转化为文本的用户和希望为其应用提供语音输入的开发者都很有用。
by @技术头条 2022-05-06 23:10 查看详情
这款功能强大的文本识别系统开源了! (mp.weixin.qq.com)
说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。
by @code小生 2022-05-05 23:08 查看详情