ผลต่างระหว่างรุ่นของ "การประมวลผลภาษาธรรมชาติในภาษาไทย"

รุ่นแก้ไขปัจจุบันเมื่อ 18:31, 9 กรกฎาคม 2557

การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เป็นกระบวนการวิเคราะ์และประมวลผลด้านภาษาที่มนุษย์ใช้กันตามปกติให้คอมพิวเตอร์เข้าใจได้ โดยได้นำไปประยุกต์ใช้ร่วมกับงานอืนๆ เช่น ปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง

เนื้อหา

1 ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ
2 รายการทรัพยากรภาษาสำหรับภาษาไทย
- 2.1 การตัดคำ
- 2.2 การติดป้ายชนิดของคำ
3 โมเดลทางภาษาที่เกี่ยวข้อง
4 เครื่องมือสำหรับนิพจน์ปกติ

ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ

รายการทรัพยากรภาษาสำหรับภาษาไทย

การตัดคำ

SWATH เป็นโปรแกรมตัดคำที่สนับสนุนการตัดคำจากหลายรูปแบบ เช่น plain text, html, rtf และ LaTeX สัญญาอนุญาตแบบ GPL
Libthai เป็นไลบรารี่ภาษาไทยที่สามารถตัดคำได้ สัญญาอนุญาตแบบ LGPL

การติดป้ายชนิดของคำ

NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ Culture Lab Orchid Mirror

โมเดลทางภาษาที่เกี่ยวข้อง

Conditional Random Field

เครื่องมือสำหรับนิพจน์ปกติ

Regexper เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine
Regexpal เครื่องมือทดสอบ regex

@@ แถว 15: / แถว 15: @@
 == โมเดลทางภาษาที่เกี่ยวข้อง ==
 * [[Conditional Random Field]]
+== เครื่องมือสำหรับนิพจน์ปกติ ==
+* [http://www.regexper.com Regexper] เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine
+* [http://regexpal.com Regexpal] เครื่องมือทดสอบ regex