ผลต่างระหว่างรุ่นของ "การประมวลผลภาษาธรรมชาติในภาษาไทย"
จาก Morange Wiki
(→การติดป้ายชนิดของคำ) |
|||
แถว 11: | แถว 11: | ||
=== การติดป้ายชนิดของคำ === | === การติดป้ายชนิดของคำ === | ||
# NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ [http://culturelab.in.th/files/orchid.html Culture Lab Orchid Mirror] | # NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ [http://culturelab.in.th/files/orchid.html Culture Lab Orchid Mirror] | ||
+ | |||
+ | |||
+ | == โมเดลทางภาษาที่เกี่ยวข้อง == | ||
+ | * [[Conditional Random Field]] |
รุ่นแก้ไขเมื่อ 09:12, 8 กรกฎาคม 2557
การประมวลผลภาษาธรรมชาติ (Natural Language Processing) เป็นกระบวนการวิเคราะ์และประมวลผลด้านภาษาที่มนุษย์ใช้กันตามปกติให้คอมพิวเตอร์เข้าใจได้ โดยได้นำไปประยุกต์ใช้ร่วมกับงานอืนๆ เช่น ปัญญาประดิษฐ์, การเรียนรู้ของเครื่อง
เนื้อหา
ขั้นตอนโดยทั่วไปในการประมวลผลภาษาธรรมชาติ
รายการทรัพยากรภาษาสำหรับภาษาไทย
การตัดคำ
- SWATH เป็นโปรแกรมตัดคำที่สนับสนุนการตัดคำจากหลายรูปแบบ เช่น plain text, html, rtf และ LaTeX สัญญาอนุญาตแบบ GPL
- Libthai เป็นไลบรารี่ภาษาไทยที่สามารถตัดคำได้ สัญญาอนุญาตแบบ LGPL
การติดป้ายชนิดของคำ
- NECTEC Orchid เป็นคลังคำที่เป็นตัวเดียวที่มีการกำกับชนิดของคำ ที่สามารถนำไปใช้ได้ พัฒนาโดย NECTEC ซึ่ง ณ ปัจจุบันลิงก์ได้หายไปแต่ได้สำเนาไว้ที่ Culture Lab Orchid Mirror