IT技术博客大学习 共学习 共进步

检测文本正文是否包含有特定词的PHP扩展

互联网,请记住我 2010-07-12 14:35:07 浏览 3,401 次

项目主页为:http://github.com/xurenlu/acfilter

1:acfilter 用于实现查询某段文本中是否含有指定的词(当前禁词越来越多的情况下,
是有必要开发一个扩展来干这个了):在词库够大的情况下,能实现一定的分词的功能;
2:acfilter 基于发布于http://code.google.com/p/pysoft/ 上的acseg完成,原有代码发布的license为New BSD license;
acfilter 仍使用New BSD lincense;
3:
安装:

tar -xzf acfilter.tar.gz
cd acfilter
phpize
./configure
make
sudo make install

安装完之后请在php.ini里加上:

extension=acfilter.so

4:使用:
示例代码:

  1. $ac=acfilter_new();
  2. var_dump($ac);
  3. acfilter_add_word($ac,"河边");
  4. acfilter_add_word($ac,"狗屎");
  5. acfilter_add_word($ac,",");
  6. acfilter_add_word($ac,"工信部");
  7. acfilter_prepare($ac);
  8. print_r(acfilter_check_text($ac,"曾经有一个很狗屎的部门,叫工信部,到河边自杀了"));
  9. acfilter_close($ac);

运行后输出为包含的各个禁词用空格连起来的一个字符串,如下所示:

resource(4) of type (Acfilter Index)
狗屎 , 工信部 , 河边

具体可参见example.php;
5:有任何Bug,请发信给:xurenlu@gmail.com,谢谢!

建议继续学习

  1. chrome扩展应用开发教程之开发chrome应用基础 (阅读 5,602)
  2. PHP内核介绍及扩展开发指南―高级主题 (阅读 4,581)
  3. chrome扩展应用开发教程之调试和打包上线 (阅读 4,421)
  4. 深入理解PHP原理之扩展载入过程 (阅读 4,381)
  5. Mediawiki扩展编写实战 (阅读 4,380)
  6. 用PHP和xapian构建全文检索 (阅读 4,362)
  7. 编写python的C语言扩展 (阅读 4,320)
  8. PHP内核介绍及扩展开发指南―类和对象 (阅读 4,001)
  9. Hermes:来自腾讯的实时检索分析平台 (阅读 3,880)
  10. 用C/C++扩展你的PHP (阅读 3,762)