ผลต่างระหว่างรุ่นของ "การประมวลผลภาษาธรรมชาติในภาษาไทย"

รุ่นแก้ไขปัจจุบันเมื่อ 18:31, 9 กรกฎาคม 2557

การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เป็นกระบวนการวิเคราะ์และประมวลผลด้านภาษาที่มนุษย์ใช้กันตามปกติให้คอมพิวเตอร์เข้าใจได้ โดยได้นำไปประยุกต์ใช้ร่วมกับงานอืนๆ เช่น ปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง

เนื้อหา

[ซ่อน]

1 ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ
2 รายการทรัพยากรภาษาสำหรับภาษาไทย
- 2.1 การตัดคำ
- 2.2 การติดป้ายชนิดของคำ
3 โมเดลทางภาษาที่เกี่ยวข้อง
4 เครื่องมือสำหรับนิพจน์ปกติ

ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ

รายการทรัพยากรภาษาสำหรับภาษาไทย

การตัดคำ

SWATH เป็นโปรแกรมตัดคำที่สนับสนุนการตัดคำจากหลายรูปแบบ เช่น plain text, html, rtf และ LaTeX สัญญาอนุญาตแบบ GPL
Libthai เป็นไลบรารี่ภาษาไทยที่สามารถตัดคำได้ สัญญาอนุญาตแบบ LGPL

การติดป้ายชนิดของคำ

NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ Culture Lab Orchid Mirror

โมเดลทางภาษาที่เกี่ยวข้อง

Conditional Random Field

เครื่องมือสำหรับนิพจน์ปกติ

Regexper เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine
Regexpal เครื่องมือทดสอบ regex

@@ แถว 10: / แถว 10: @@
 === การติดป้ายชนิดของคำ ===
-# [[NECTEC Orchid]]
+# NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ [http://culturelab.in.th/files/orchid.html Culture Lab Orchid Mirror]
+== โมเดลทางภาษาที่เกี่ยวข้อง ==
+* [[Conditional Random Field]]
+== เครื่องมือสำหรับนิพจน์ปกติ ==
+* [http://www.regexper.com Regexper] เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine
+* [http://regexpal.com Regexpal] เครื่องมือทดสอบ regex