ผลต่างระหว่างรุ่นของ "การประมวลผลภาษาธรรมชาติในภาษาไทย"
จาก Morange Wiki
แถว 15: | แถว 15: | ||
== โมเดลทางภาษาที่เกี่ยวข้อง == | == โมเดลทางภาษาที่เกี่ยวข้อง == | ||
* [[Conditional Random Field]] | * [[Conditional Random Field]] | ||
+ | |||
+ | |||
+ | |||
+ | == เครื่องมือสำหรับนิพจน์ปกติ == | ||
+ | * [http://www.regexper.com Regexper] เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine | ||
+ | * [http://regexpal.com Regexpal] เครื่องมือทดสอบ regex |
รุ่นแก้ไขปัจจุบันเมื่อ 18:31, 9 กรกฎาคม 2557
การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เป็นกระบวนการวิเคราะ์และประมวลผลด้านภาษาที่มนุษย์ใช้กันตามปกติให้คอมพิวเตอร์เข้าใจได้ โดยได้นำไปประยุกต์ใช้ร่วมกับงานอืนๆ เช่น ปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง
เนื้อหา
ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ
รายการทรัพยากรภาษาสำหรับภาษาไทย
การตัดคำ
- SWATH เป็นโปรแกรมตัดคำที่สนับสนุนการตัดคำจากหลายรูปแบบ เช่น plain text, html, rtf และ LaTeX สัญญาอนุญาตแบบ GPL
- Libthai เป็นไลบรารี่ภาษาไทยที่สามารถตัดคำได้ สัญญาอนุญาตแบบ LGPL
การติดป้ายชนิดของคำ
- NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ Culture Lab Orchid Mirror
โมเดลทางภาษาที่เกี่ยวข้อง