Natural Language Toolkit
Το Natural Language Toolkit ή NLTK είναι μια συλλογή βιβλιοθηκών λογισμικού υλοποιημένων σε Python που επιτρέπουν τη συμβολική και στατιστική επεξεργασία φυσικής γλώσσας (αγγλικά: Natural language processing, NLP). Υποστηρίζει την ταξινόμηση, τη λεξική τμηματοποίηση (tokenization), τη λημματοποίηση (lemmatization), την αποπροσφυματοποίηση (stemming) καθώς και τη συντακτική και σημασιολογική ανάλυση κειμένου.[1] Το ανέπτυξαν οι Steven Bird και Edward Loper από το Πανεπιστήμιο της Πενσυλβάνια.[2]
Το NLTK συνοδεύεται από εγχειρίδιο στο οποίο παρουσιάζονται οι θεμελιώδεις αρχές του πεδίου[3] και υλοποιήθηκε για να υποστηρίξει τη διδασκαλία και την έρευνα πάνω στην επεξεργασία φυσικής γλώσσας καθώς και άλλων σχετιζόμενων αντικειμένων όπως η γνωσιακή επιστήμη, η ανάκτηση πληροφορίας, η μηχανική μάθηση και η τεχνητή νοημοσύνη.[4]
Παραπομπές
[Επεξεργασία | επεξεργασία κώδικα]- ↑ «NLTK Courses». Google Docs. Ανακτήθηκε στις 15 Ιουνίου 2016.
- ↑ «Preface». www.nltk.org. Ανακτήθηκε στις 15 Ιουνίου 2016.
- ↑ Bird, Steven· Klein, Ewan· Loper, Edward (2009). Natural Language Processing with Python. O'Reilly Media Inc. ISBN 978-0-596-51649-9.
- ↑ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). Multidisciplinary instruction with the Natural Language Toolkit. Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. http://aclweb.org/anthology-new/W/W08/W08-0208.pdf.