Μετάβαση στο περιεχόμενο

Natural Language Toolkit

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Το Natural Language Toolkit ή NLTK είναι μια συλλογή βιβλιοθηκών λογισμικού υλοποιημένων σε Python που επιτρέπουν τη συμβολική και στατιστική επεξεργασία φυσικής γλώσσας (αγγλικά: Natural language processing, NLP). Υποστηρίζει την ταξινόμηση, τη λεξική τμηματοποίηση (tokenization), τη λημματοποίηση (lemmatization), την αποπροσφυματοποίηση (stemming) καθώς και τη συντακτική και σημασιολογική ανάλυση κειμένου.[1] Το ανέπτυξαν οι Steven Bird και Edward Loper από το Πανεπιστήμιο της Πενσυλβάνια.[2]

Το NLTK συνοδεύεται από εγχειρίδιο στο οποίο παρουσιάζονται οι θεμελιώδεις αρχές του πεδίου[3] και υλοποιήθηκε για να υποστηρίξει τη διδασκαλία και την έρευνα πάνω στην επεξεργασία φυσικής γλώσσας καθώς και άλλων σχετιζόμενων αντικειμένων όπως η γνωσιακή επιστήμη, η ανάκτηση πληροφορίας, η μηχανική μάθηση και η τεχνητή νοημοσύνη.[4]

  1. «NLTK Courses». Google Docs. Ανακτήθηκε στις 15 Ιουνίου 2016.
  2. «Preface». www.nltk.org. Ανακτήθηκε στις 15 Ιουνίου 2016.
  3. Bird, Steven· Klein, Ewan· Loper, Edward (2009). Natural Language Processing with Python. O'Reilly Media Inc. ISBN 978-0-596-51649-9.
  4. Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). Multidisciplinary instruction with the Natural Language Toolkit. Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. http://aclweb.org/anthology-new/W/W08/W08-0208.pdf.

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]