您现在的位置:首页 --> 查看专题: 神经网络
前几天,看到了东北大学小牛翻译团队开源的语料项目:文言文(古文)-现代文平行语料 ,这个项目整理了非常全的文言文(古文)- 现代文(白话文)对齐数据,基本涵盖了大部分经典古籍著作,并且对原始爬取的篇章级对齐数据进行了断句及人工校对,形成了共计约96万句对的文言文-白话文对齐(平行)语料。
这份语料数据很珍贵,看到的第一眼想到就是用这份文言文现代文对齐语料训练一个文言文白话文转换器:文言文转白话文,文言文转现代文,白话文转文言文,现代文转文言文,古文转白话文,白话文转古文,古文转现代文,现代文转古文。
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
-
[83] memory prefetch浅析
-
[55] 转载:cassandra读写性能原理分析
-
[52] 深入浅出cassandra 4 数据一致性问
-
[50] 基本排序算法的PHP实现
-
[45] 字符引用和空白字符
-
[41] MySQL半同步存在的问题
-
[41] 获取Dom元素的X/Y坐标
-
[41] Inline Form Labels
-
[41] JS中如何判断字符串类型的数字
-
[40] javascript插入样式
赞助商广告