IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

自己做了个简繁转换的东西

Dash's Blog 2009-11-02 12:27:54 累计浏览 3,310 次
本机暂存

因为这两天在整理easymule的网站,需要把一些文字转换为繁体,却找不到好用的转换工具。

因为简繁转换特别麻烦,简体字和繁体字并不是一一对应的,往往一个简体字对应多个繁体字,例如“面”字,上面下面的时候,繁简是同一个字,而“面条”的“面”却是对应“麵”字。

第二个崩溃的问题是,自从繁简分家后,所有的新词语几乎都变成了两种完全不同的说法,例如:“軟體”、“下載檔”等等,需要有一个词汇表进行翻译。

目前网上流行的简繁转换程序,基本上都没有处理以上这2个问题,无法满足我的使用需求,于是只好自己来解决。 参考了一下维基百科中文版的处理方式和词汇表,自己写了个简单的转换程序:
http://www.easymule.com/misc/ChineseConverter.php

虽然还不能完美解决我所说的那两个问题(事实上两岸用语习惯上的差异,已经不肯能完全靠机器解决了) ,但至少能自己方便的修改转换表,通过增加转换表中的内容,来提高转换的准确性。

下面是程序的源代码,里面用到的”zhtable.php”,就是MediaWiki中的ZhConversion.php,自己作了些修改。

<?php
include_once( ‘zhtable.php’ );
$input = isset($_POST['input'])?$_POST['input']:”";
$new_needle = array_merge($zh2TW, $zh2Hant1, $zh2Hant2, $zh2Hant3);
$needle = array_keys($new_needle);
$output = str_replace($needle, $new_needle, $input);
?>
<!-#set var=title value=’简繁转换工具 - 电驴’ ->
<!-#include virtual=”../zh-cn/_includes/head.html” ->
<form name=”ChineseConverter” action=”ChineseConverter.php” method=”post”>
简体:<textarea name=”input” style=”width:500px;height:200px;”>
<?php print(htmlspecialchars($input));?>
</textarea>
<br/>
繁体:<textarea name=”output” style=”width:500px;height:200px;”>
<?php print(htmlspecialchars($output));?>
</textarea>
<br/>
<input type=”submit” value=”转换”/>
</form>
<!-#include virtual=”../zh-cn/_includes/foot.html” ->

同分类推荐文章

  1. 从”内容治理”到”行为治理”:中国智能体治理框架深度解析与绿盟科技实践 (2026-06-23 21:49:28)
  2. 美团海报生成 AIGC 技术创新与实践 (2026-06-22 15:34:28)
  3. AI Coding Agent 时代,我自己最常用的 4 个终端工具 (2026-06-22 08:00:00)

查看更多 AI 文章 →

建议继续学习

  1. 读书笔记-壹百度:百度十年千倍的29条法则 (累计阅读 16,097)
  2. perl更新/修改/删除文本文件内容 (累计阅读 10,646)
  3. AWK 简明教程 (累计阅读 9,365)
  4. AWK介绍 (累计阅读 6,707)
  5. awk 实例之二维数组 (累计阅读 6,012)
  6. Perl命令行常见用法及技巧 (累计阅读 5,912)
  7. 正则表达式的与或非 (累计阅读 5,869)
  8. 朋友,不要再打听彼此薪水 (累计阅读 4,768)
  9. 百度这个公司 (累计阅读 4,705)
  10. 失败的人生 (累计阅读 4,696)