ผลต่างระหว่างรุ่นของ "การประมวลผลภาษาธรรมชาติในภาษาไทย"
จาก Morange Wiki
(หน้าที่ถูกสร้างด้วย ''''การประมวลผลภาษาธรรมชาติ''' (Natural Language Processing) เป็นกระบว...') |
|||
(ไม่แสดง 2 รุ่นระหว่างกลางโดยผู้ใช้คนเดียวกัน) | |||
แถว 10: | แถว 10: | ||
=== การติดป้ายชนิดของคำ === | === การติดป้ายชนิดของคำ === | ||
− | # [[ | + | # NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ [http://culturelab.in.th/files/orchid.html Culture Lab Orchid Mirror] |
+ | |||
+ | |||
+ | == โมเดลทางภาษาที่เกี่ยวข้อง == | ||
+ | * [[Conditional Random Field]] | ||
+ | |||
+ | |||
+ | |||
+ | == เครื่องมือสำหรับนิพจน์ปกติ == | ||
+ | * [http://www.regexper.com Regexper] เครื่องมือสำหรับตรวจสอบและvisualize เป็น state machine | ||
+ | * [http://regexpal.com Regexpal] เครื่องมือทดสอบ regex |
รุ่นแก้ไขปัจจุบันเมื่อ 18:31, 9 กรกฎาคม 2557
การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เป็นกระบวนการวิเคราะ์และประมวลผลด้านภาษาที่มนุษย์ใช้กันตามปกติให้คอมพิวเตอร์เข้าใจได้ โดยได้นำไปประยุกต์ใช้ร่วมกับงานอืนๆ เช่น ปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง
เนื้อหา
ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ
รายการทรัพยากรภาษาสำหรับภาษาไทย
การตัดคำ
- SWATH เป็นโปรแกรมตัดคำที่สนับสนุนการตัดคำจากหลายรูปแบบ เช่น plain text, html, rtf และ LaTeX สัญญาอนุญาตแบบ GPL
- Libthai เป็นไลบรารี่ภาษาไทยที่สามารถตัดคำได้ สัญญาอนุญาตแบบ LGPL
การติดป้ายชนิดของคำ
- NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ Culture Lab Orchid Mirror
โมเดลทางภาษาที่เกี่ยวข้อง