تصنيف البيانات باستخدام خوارزميات التعلم المختلفة: أخبار المدرسة الحالية

تصنيف البيانات باستخدام خوارزميات التعلم المختلفة

 - تصنيف البيانات باستخدام خوارزميات التعلم المختلفة -

تحميل تصنيف البيانات باستخدام خوارزميات التعلم المختلفة مواد المشروع: مادة المشروع هذه جاهزة للطلاب الذين يحتاجونها للمساعدة في أبحاثهم.

الملخص  

تخفيض الأبعاد يوفر تمثيلًا مضغوطًا لملف البيانات الأصلية عالية الأبعاد ، مما يعني أن البيانات المختصرة خالية من أي معالجة إضافية ويتم الاحتفاظ بالمعلومات الحيوية فقط. لهذا السبب ، إنها خطوة معالجة مسبقة لا تقدر بثمن قبل تطبيق الكثيرين خوارزميات التعلم الآلي التي تعمل بشكل سيئ على البيانات عالية الأبعاد. في هذه الأطروحة ، يتم تطبيق خوارزمية تصنيف الإدراك الحسي - المتعلم الشغوف - على ثلاث مجموعات بيانات من فئتين (مجموعات بيانات الطالب والطقس والأيونوسفير).

يتم أيضًا تطبيق خوارزمية تصنيف k-Nearest Neighbours - المتعلم الكسول - على نفس مجموعات البيانات ذات الفئتين. يتم بعد ذلك تقليل كل مجموعة بيانات باستخدام خمسة عشر أسلوبًا مختلفًا لتقليل الأبعاد. المدرك و ك تصنيف الجار الأقرب يتم تطبيق الخوارزميات على كل مجموعة مخفضة وتتم مقارنة الأداء (الذي تم تقييمه باستخدام مصفوفة الارتباك) لتقنيات تقليل الأبعاد في الحفاظ على تصنيف مجموعة البيانات من خلال k- الجيران الأقرب وخوارزميات تصنيف perceptron.

كشف هذا التحقيق أن تقنيات تقليل الأبعاد المطبقة في هذه الأطروحة يبدو أنها تؤدي أداءً أفضل بكثير في الحفاظ على تصنيف K-Nearest Neighbor مما تفعله في الحفاظ على تصنيف الجار الأقرب. تصنيف مجموعات البيانات الأصلية باستخدام بيرسبترون. بشكل عام ، أثبتت تقنيات تقليل الأبعاد أنها فعالة جدًا في الحفاظ على تصنيف كل من المتعلمين الكسالى والمتحمسين المستخدمة في هذا التحقيق. 

مقدمة  

تتزايد أحجام البيانات وتنوعها بمعدل ينذر بالخطر مما يجعل أي محاولة مملة للغاية لجمع معلومات مفيدة من مجموعات البيانات الكبيرة هذه. أصبح استخراج المعلومات المفيدة والأنماط المخفية من البيانات أو التنقيب عنها أكثر أهمية ، ولكن يمكن أن يمثل تحديًا كبيرًا في نفس الوقت. تتعامل الكثير من الأبحاث التي أجريت في مجالات مثل علم الأحياء وعلم الفلك والهندسة ومعاملات المستهلك والزراعة مع مجموعات واسعة من الملاحظات يوميًا.

تواجه التقنيات الإحصائية التقليدية بعض التحديات في تحليل مجموعات البيانات هذه نظرًا لأحجامها الكبيرة. التحدي الأكبر هو عدد المتغيرات (الأبعاد) المرتبطة بكل ملاحظة. ومع ذلك ، ليست كل الأبعاد مطلوبة لفهم الظاهرة قيد البحث فيمجموعات بيانات الأبعاد وهذا يعني أن تقليل أبعاد مجموعة البيانات يمكن أن يحسن دقة وكفاءة التحليل.

بعبارة أخرى ، سيكون من المفيد جدًا أن نتمكن من تعيين مجموعة من النقاط ، على سبيل المثال n ، في الفضاء ذي البعد d إلى فضاء ذي بُعد p - حيث p < احة دبي للسيليكون أن الخصائص المتأصلة لمجموعة النقاط هذه ، مثل مسافاتها بين النقاط ، وتسمياتها ، وما إلى ذلك ، لا تعاني من تشويه كبير. تُعرف هذه العملية باسم تقليل الأبعاد. توجد الكثير من الطرق لتقليل أبعاد البيانات.

هناك فئتان من هذه الأساليب ؛ في الفئة الأولى ، تكون كل سمة في مجموعة البيانات المختصرة عبارة عن مجموعة خطية من سمات مجموعة البيانات الأصلية. في الفئة الثانية ، تكون مجموعة السمات في مجموعة البيانات المصغرة عبارة عن مجموعة فرعية من مجموعة السمات في مجموعة البيانات الأصلية. 

المراجع

N. Sharma and K. Saroha ، "دراسة منهجيات تقليل الأبعاد في استخراج البيانات ،"
في المؤتمر الدولي للحوسبة والاتصالات والأتمتة ، 2015 ، ص.
133-137.

IK Fodor ، "مسح لتقنيات تقليل الأبعاد" ، مركز العلوم التطبيقية
الحوسبة ، مختبر لورانس ليفرمور الوطني ، لا. 1 ، ص 1-18 ، 2002.

D. Achlioptas ، "التوقعات العشوائية الملائمة لقواعد البيانات: Johnson-Lindenstrauss مع نظام ثنائي
عملات معدنية ، "J. Comput. نظام. علوم ، المجلد. 66 ، لا. 4 ، ص 671-687 ، 2003.

AS Nsang، I. Diaz، and A. Ralescu، “Ensemble Clustering based on Heterogeneous
طرق تقليل الأبعاد ومقاييس التشابه المعتمدة على السياق ، "كثافة العمليات. ج.
حال. علوم. Technol. ، المجلد. 64 ، ص 101-118 ، 2014.

AS Nsang و A. Maikori و F. Oguntoyinbo و H. Yusuf ، "A New Random Approach To
تقليل الأبعاد "، في Int'l Conf. على التقدم في تحليلات البيانات الضخمة | ABDA'15 | ،
2014 ، المجلد. 60 ، لا. 6 ، ص 2114-2142.

ديشموخ ، ت. غورباد ، ب. باديا ، "تحسين التصنيف باستخدام
خوارزميات المعالجة المسبقة والتعلم الآلي على مجموعة بيانات NSL-KDD "، في الإجراءات -
2015 المؤتمر الدولي للاتصالات والمعلومات والحوسبة
التكنولوجيا ، ICCICT 2015 ، 2015.

I. Kalamaras ، "نهج جديد لتقليل أبعاد الرسم البياني متعدد الوسائط ،"
إمبريال كوليدج لندن ، 2015.

كافاكيوتيس ، أو. تسايف ، أ. ساليفوغلو ، إن. ماغلافيراس ، آي فلاهافاس ، وإي. شوفاردا ،
"التعلم الآلي وطرق التنقيب عن البيانات في أبحاث مرض السكري ،" كمبيوت. هيكل.
التكنولوجيا الحيوية. J. ، المجلد. 15 ، ص 104-116 ، 2017.

TM ميتشل ، تعلم الآلة ، المجلد. 1 ، لا. 3. 1997.

SB Kotsiantis ، "التعلم الآلي الخاضع للإشراف: مراجعة لتقنيات التصنيف ،"
انفورماتيكا ، المجلد. 31 ، ص 249-268 ، 2007.

فريق CSN.

الاوسمة المتعلقة بالخدمة (تاج): , , ,

التعليقات مغلقة.

مرحبا Hi

لا تفوت هذه الفرصة

أدخل التفاصيل الخاصة بك