文本语义纠错的使用场景非常广泛，基本上只要涉及到写作就有文本纠错的需求。书籍面市前就有独立的校对的环节来保障出版之后不出现明显的问题。在新闻中我们也时不时看到因为文字审核没到位造成大乌龙的情况，包括上市公司在公开文书上把“临时大会”写成为“临死大会”，政府文件把“报效国家”写成了“报销国家”。有关文本纠错的辅助工具能给文字工作人员带来较大的便利，对审核方面的风险也大幅降低。

查看详情

无图

52 www.52nlp.cn / 2022-12-10 22:41

光学字符识别OCR技术（Optical Character Recognition）是指从图像中自动提取文字信息的技术。这项技术横跨了人工智能里的两大领域：CV（计算机视觉）和NLP（自然语言处理），综合使用了这两大领域中的很多技术成果。

在过往40余年的技术发展历程中，OCR始终具备很强的产业应用背景，是计算机领域里少数几个一开始就由工业界和学术界双轮驱动的领域。近年来OCR技术已经在工业界成熟落地应用，学术界里对此的研究热度反而弱于其他方向。甚至有人认为OCR技术已经充分成熟，没有更多研究必要了。然而随着近年来智能文本处理IDP（Intelligent Document Processing）在工业界的逐步落地应用，OCR和IDP相结合的应用场景越来越多，用语义理解NLP的角度进一步去延伸OCR的应用，出现了很多更有产业应用价值的场景。本文回顾了OCR技术的发展历程，并结合达观数据在工程实践方面的经验，介绍与语义分析技术结合后，当前OCR技术的一些最新发展和落地经验。

查看详情

无图

zh www.zhangxinxu.com / 2022-08-18 23:39

基于文字的URL锚点定位与::target-text样式设置

文字选区片段高亮又新增一名成员，可以使用 ::target-text 伪元素进行匹配，反正耽误不了几分钟，过来看看，说不定之后用得着。

查看详情

无图

se www.sec-un.org / 2022-06-19 23:19

洋葱式信息安全观察：浅议虚假信息识别

虚假信息对经济、政治等有着重大影响，因此研究威胁信息检测的重要性也凸显出来，尤其是在这个全球“抗疫”的时期。虚假信息的检测方法和技术很多，本文仅进行了部分介绍。需要注意的是，数据集对虚假信息检测的准确性也有很大影响，需要我们重点关注。
互联网时代检测虚假信息虽然很棘手，但事实证明通过大量的知识积累，我们仍然可以在检测虚假信息的工作上取得良好效果。

查看详情

无图

zh www.zhangxinxu.com / 2022-06-19 22:31

使用CSS size-adjust和unicode-range改变任意文字尺寸

介绍一个无需HTML标签就能控制任意字符字号大小的CSS技术，关键时候说不定可以救命，都来学学吧。

查看详情

无图

li linux.cn / 2022-05-06 23:10

使用 DeepSpeech 在你的应用中实现语音转文字

应用中的语音识别不仅仅是一个有趣的技巧，而且是一个重要的无障碍功能。

计算机的主要功能之一是解析数据。有些数据比其他数据更容易解析，而语音输入仍然是一项进展中的工作。不过，近年来该领域已经有了许多改进，其中之一就是 DeepSpeech，这是 Mozilla 的一个项目，Mozilla 是维护 Firefox 浏览器的基金会。DeepSpeech 是一个语音到文本的命令和库，使其对需要将语音输入转化为文本的用户和希望为其应用提供语音输入的开发者都很有用。

查看详情

无图

mp mp.weixin.qq.com / 2022-05-05 23:08

这款功能强大的文本识别系统开源了！

说到文本识别大家已经非常熟悉了，这一技术早就深深融入我们生活的方方面面，今天，猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时，它能快速判断它是否是 email、油管视频编号、手机号或者是其他信息格式。你给它一个 .pcap 文件或者一段文本，它能告诉你这个文件或是文本代表了什么。

查看详情

无图

谈一谈OCR文字识别

赞过的人

发表评论

相关分享