How to impliment a Part-of-Speech (POS) tagger(如何实现词性 (POS) 标注器)
问题描述
我正在寻找基于 PHP 的最佳方式来扫描大量文本条目(分类广告)并提取关键字 - 有人知道词性标记吗?有没有类似 PHP 的方法来做到这一点?
I'm looking for the best PHP-based way to scan a lot of text entries (classifieds) and pull out keywords - anyone know about Part-of-Speech tagging? Is there a PHP-ish way to do this?
我扫描了很多在线分类广告 - 但没有一个分类!为了加快分类过程,我希望安装一个词性标注器 (http://en.wikipedia.org/wiki/Part-of-speech_tagging).基本上,这些是很酷的文本解析算法软件包,可以告诉我哪些词是名词(如Apartment"、Car"、Dog"等)以及哪些词是垃圾,例如 at、if、and、but 等.但是...
I scan a lot of online classifieds - but none with categories! To speed up the categorization process, I'm looking to install a Part-of-Speech tagger (http://en.wikipedia.org/wiki/Part-of-speech_tagging). Basically, these are cool text-parsing algorithmic software bundles that can tell me what words are nouns (like "Apartment", "Car", "Dog", etc) and what words are junk like at,if,and,but,etc. BUT...
有在线标记服务——雅虎提供的一个,最近似乎越来越少了——施乐的另一个.不过,我真的很想安装我自己的库/软件并将其插入我的网络应用程序.
There are online tagging services - one by Yahoo, which seems to be getting less love these days - another by XEROX. However, I'm really interested in installing my own library/software and plugging it into my web app.
有人知道安装与 PHP Web 应用程序一起使用的 POS 标记的好方法吗?我很想弄清楚这一点,因此非常感谢您提供的任何信息、建议或其他智慧!
DOES ANYONE know of a good way to install POS tagging that works with a PHP web application? I'm dying to figure this out, so any info, advice, or other wisdom you have is really appreciated!
这里列出了许多不同的 POS 软件:http://www-nlp.stanford.edu/links/statnlp.html#Taggers(查看POS 标记")
Here's a list of a LOT of different POS software: http://www-nlp.stanford.edu/links/statnlp.html#Taggers (Look under "POS Taggers")
感谢您阅读本文!
推荐答案
Ian Barber 用 PHP 实现了一个 Brill Tagger,他在他的 PHP/ir 网站,他描述了使用它来分析推文.
Ian Barber has implemented a Brill Tagger in PHP, which he presents on his PHP/ir site where he describes using it to analyse tweets.
这篇关于如何实现词性 (POS) 标注器的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:如何实现词性 (POS) 标注器
基础教程推荐
- Cron Jobs 调用带有变量的 PHP 脚本 2022-01-01
- 如何在 Laravel 5.3 注册中添加动态下拉列表列? 2021-01-01
- 在PHP中根据W3C规范Unicode 2022-01-01
- PHP 类:全局变量作为类中的属性 2021-01-01
- 如何在 Laravel 中使用 React Router? 2022-01-01
- 如何替换eregi() 2022-01-01
- YouTube API v3 点赞视频,但计数器不增加 2022-01-01
- 学说 dbal querybuilder 作为准备好的语句 2022-01-01
- 有什么方法可以用编码 UTF-8 而不是 Unicode 返回 PHP`json_encode`? 2021-01-01
- PHP PDO MySQL 查询 LIKE ->多个关键词 2021-01-01
