Son yıllarda teknolojinin gelişmesi ve internet kullanım oranının artmasıyla mikroblog adı verilen sosyal medya platformları, milyarlarca insanın çeşitli konularda görüşlerini, fikirlerini, duygularını ve şikayetlerini paylaştığı platformlar haline gelmiştir. Sosyal medya kullanımının dünya genelinde yaygınlaşması ile şikayet, öneri, talep bildirimleri sadece web siteleri, telefon veya e-mail aracılığıyla değil, sosyal medya özellikle Twitter aracılığıyla da paylaşılmaktadır. Firmaların, Twitter aracılığı ile gerçekleştirdikleri hızlı geri dönüşler ve alınan aksiyonlar müşteri memnuniyeti açısından büyük önem arz etmektedir. Özellikle müşteriyle direkt iletişim halinde olması gereken hizmet sektörü, memnuniyeti artırmak ve daha iyi hizmet sunmak amacıyla müşterileriyle Twitter üzerinden iletişime geçmektedir. Bu tez çalışmasında, Türk havacılık sektöründe yer alan firmaların, misafirleriyle Twitter üzerinden gerçekleştirdikleri iletişimi hızlandırmak ve konunun şirket içinde ilgili departmana ulaşmasını kolaylaştırmak, harcanan insan eforunu ve hata payını en aza indirmek amacıyla metin madenciliği çalışması gerçekleştirilmiştir. Türk havayolu firmaları hakkında yapılan 14.406 adet Türkçe Twitter paylaşımı üzerinde, doğal dil işleme ve metin madenciliği çalışmaları gerçekleştirilerek, havayolu firmalarının web sitelerinde yer alan sık sorulan sorular başlıklarından belirlenen konu başlıklarına göre ilgili tweet'in hangi başlık altında yer aldığı, Naive Bayes, Destek Vektör Makineleri, Lojistik Regresyon, Karar Ağaçları, Rastgele Orman geleneksel makine öğrenmesi algoritmaları, Adaboost, XGBoost, Bagging topluluk öğrenme yöntemleri ile CNN ve LSTM derin öğrenme algoritmaları kullanılarak sınıflandırılmıştır. Sınıflandırma başarılarını ölçmek için geleneksel yöntemler ve topluluk yöntemlerinde farklı öznitelik seçim yöntemleri ve öznitelik sayıları parametre olarak belirlenirken derin öğrenme yöntemlerinde farklı aktivasyon fonksiyonları ile deneyler gerçekleştirilmiştir. Çalışma sonucunda, geleneksel yöntemlerden SVM, topluluk öğrenmesi yöntemlerinden XGBoost ve derin öğrenme yöntemleri ile yaklaşık %77 doğruluk oranı elde edilmiştir.
The development of technology in recent years and increase internet usage ratio called the microblog Twitter, Facebook-like social media platforms, billions of views on various issues of people, ideas, has become a platform shared their feelings and complaints. With the widespread use of social media around the world, complaints, suggestions, and request notifications are shared not only through websites, phone, or e-mail, but also via social media, especially Twitter. Fast feedbacks and actions taken by companies via Twitter are of great importance for customer satisfaction. In particular, the service sector, which should be in direct contact with the customer, communicates with its customers via Twitter in order to increase satisfaction, and provide better service. In this thesis, a text mining study was carried out in order to accelerate the communication of companies in the Turkish aviation industry with their guests via Twitter, to facilitate the issue to reach the relevant department within the company, and to minimize the human effort and margin of error. Natural language processing and text mining studies were carried out on 14,406 Turkish Twitter posts about Turkish airline companies, according to the topics determined from the frequently asked questions titles on the websites of the airline companies, under which heading the relevant tweet is located, Naive Bayes, Support Vector The machines are classified using Logistic Regression, Decision Trees, Random Forest traditional machine learning algorithms, Adaboost, XGBoost, Bagging ensemble learning methods and CNN and LSTM deep learning algorithms. In order to measure the classification success, different feature selection methods and feature numbers were determined as parameters in traditional methods and ensemble methods, while experiments were carried out with different activation functions in deep learning methods. As a result of the study, approximately 77% accuracy rate was obtained with SVM from traditional methods, XGBoost from ensemble learning methods and deep learning methods.