ผลต่างระหว่างรุ่นของ "การประมวลผลภาษาธรรมชาติในภาษาไทย"

จาก Morange Wiki
(หน้าที่ถูกสร้างด้วย ''''การประมวลผลภาษาธรรมชาติ''' (Natural Language Processing) เป็นกระบว...')
 
 
(ไม่แสดง 2 รุ่นระหว่างกลางโดยผู้ใช้คนเดียวกัน)
แถว 10: แถว 10:
  
 
=== การติดป้ายชนิดของคำ ===
 
=== การติดป้ายชนิดของคำ ===
# [[NECTEC Orchid]]
+
# NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ [http://culturelab.in.th/files/orchid.html Culture Lab Orchid Mirror]
 +
 
 +
 
 +
== โมเดลทางภาษาที่เกี่ยวข้อง ==
 +
* [[Conditional Random Field]]
 +
 
 +
 
 +
 
 +
== เครื่องมือสำหรับนิพจน์ปกติ ==
 +
* [http://www.regexper.com Regexper] เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine
 +
* [http://regexpal.com Regexpal] เครื่องมือทดสอบ regex

รุ่นแก้ไขปัจจุบันเมื่อ 18:31, 9 กรกฎาคม 2557

การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เป็นกระบวนการวิเคราะ์และประมวลผลด้านภาษาที่มนุษย์ใช้กันตามปกติให้คอมพิวเตอร์เข้าใจได้ โดยได้นำไปประยุกต์ใช้ร่วมกับงานอืนๆ เช่น ปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง

ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ

รายการทรัพยากรภาษาสำหรับภาษาไทย

การตัดคำ

  1. SWATH เป็นโปรแกรมตัดคำที่สนับสนุนการตัดคำจากหลายรูปแบบ เช่น plain text, html, rtf และ LaTeX สัญญาอนุญาตแบบ GPL
  2. Libthai เป็นไลบรารี่ภาษาไทยที่สามารถตัดคำได้ สัญญาอนุญาตแบบ LGPL

การติดป้ายชนิดของคำ

  1. NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ Culture Lab Orchid Mirror


โมเดลทางภาษาที่เกี่ยวข้อง


เครื่องมือสำหรับนิพจน์ปกติ

  • Regexper เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine
  • Regexpal เครื่องมือทดสอบ regex