تشكيلالتعليم والمدارس الثانوية

أقرب طريقة الجيران: مثال على العمل

أقرب طريقة الجار هو أسهل المصنف المتري الذي يقوم على أساس تقييم تشابه كائنات مختلفة.

الكائن تحليل ينتمي إلى الطبقة التي ينتمون إليها موضوعات عينة التدريب. دعونا معرفة ما الذي هو أقرب جار. محاولة لفهم مسألة معقدة، أمثلة على تقنيات مختلفة.

طريقة الفرضية

يمكن اعتبار أقرب طريقة الجار كما خوارزمية الأكثر شيوعا للتصنيف. وجوه تمر تصنيف ينتمي إلى الطبقة y_i، التي تكون أقرب كائن تعلم عينة x_i.

خصوصية أساليب أقرب الجيران

ك أقرب الجيران طريقة يمكن أن تحسن دقة التصنيف. الكائن تحليل ينتمي إلى نفس الفئة الجزء الأكبر من جيرانها، وهذا هو، ك على مقربة منه الكائنات من x_i عينة تم تحليلها. في حل المشاكل مع فئتين من عدد من الدول المجاورة سيكون غريبا لتجنب حالة من الغموض، وإذا كان نفس العدد من الجيران سوف تنتمي إلى فئات مختلفة.

تقنية الجيران مع وقف التنفيذ

طريقة تحليل كيو tsvector أقرب الجيران يستخدم عندما يكون عدد من الفئات الثلاث على الأقل، ولا يمكنك استخدام عدد فردي. لكن الغموض الذي يطرح نفسه حتى في هذه الحالات. ثم، الجار ط ال يحصل على الوزن w_i، مما يقلل بدرجة جار ط. وهو يشير إلى فئة الكائن، والتي سوف يكون الحد الأقصى لإجمالي وزن بين الجيران وثيق.

فرضية الاكتناز

في قلب كل من الأساليب المذكورة أعلاه هي فرضية الاكتناز. فإنه يشير إلى وجود علاقة بين قدر من التشابه بين الأشياء وينتمون لنفس الفئة. في هذه الحالة، الحدود بين الأنواع المختلفة هو شكل بسيط، وخلق فئات من الأجسام في الفضاء مجال المحمول المدمجة. في ظل هذه المناطق في التحليل الرياضي المتخذة لتعني مجموعة محاطة مغلقة. لا علاقة هذه الفرضية إلى تصور الحياة اليومية للكلمة.

الصيغة الأساسية

دعونا نفحص المزيد من أقرب جار. إذا كان التدريب المقترح نوع عينة "كائن استجابة» X ^ م = \ {(X_1، y_1)، \ النقاط، (x_m، y_m) \}؛ إذا تعدد الكائنات لتحديد المسافة وظيفة \ رو (س، س)، والتي تتمثل في شكل تشابه نموذج ملائم من الكائنات عن طريق زيادة قيمة الدالة يقلل التشابه بين الأشياء س، س '.

عن أي موضوع، وسوف ش إنشاء نموذج التدريب الكائنات x_i مع زيادة المسافات لش:

\ رو (ش، X_ {1؛ يو}) \ LEQ \ رو (ش، X_ {2، ش}) \ LEQ \ cdots \ LEQ \ رو (ش، X_ {م؛ ش})،

حيث X_ {ط. ش} يميز نموذج التعلم الكائن، الذي هو أنا وال كائن مصدر الجار ش. هذا التدوين واستخدام للرد على جاره ط عشر: y_ {ط. ش}. ونتيجة لذلك، نجد أن أي كائن ش يثير إعادة ترقيم العينة الخاصة.

تحديد ك عدد من الجيران

أقرب طريقة الجيران عندما ك = 1 غير قادر على إعطاء تصنيف خاطئ، وليس فقط على الكائنات انبعاثات، ولكن أيضا لفئات أخرى قريبة.

وإذا أخذنا ك = م، فإن خوارزمية تكون مستقرة كما وسوف تتحول إلى قيمة ثابتة. هذا هو السبب في الموثوقية مهمة لتجنب مؤشرات المتطرفة ك.

في الممارسة العملية، حيث أن مؤشر ك الأمثل استخدام معيار انزلاق السيطرة.

انبعاثات عروض

الكائنات من الدراسة غير متكافئة إلى حد كبير، ولكن يوجد من بينهم أولئك الذين لديهم خصائص فئة ويشار إلى المعايير. في القرب من هذا الموضوع إلى النموذج المثالي من احتمال عال من ينتمون إلى هذه الفئة.

كيف rezultativen طريقة أقرب الجيران؟ على سبيل المثال يمكن أن ينظر إليه على أساس فئات هامشية وغير مفيدة من الكائنات. ومن المفترض بيئة كثيفة من وجوه الممثلين الآخرين من هذه الفئة. عند إخراجها من تصنيف أخذ عينات من نوعية لن تعاني.

وصول الى عدد معين من العينات قد رشقات نارية الضوضاء التي هي "على الارض" من فئة. إزالة تأثير إيجابي كبير على نوعية التصنيف.

إذا اتخذت عينة من الكائنات الضوضاء غير المفيدة والقضاء، يمكنك الاعتماد على عدد قليل من النتائج الإيجابية في نفس الوقت.

أول طريقة الاستيفاء من أقرب جار تصنيف يسمح لتحسين الجودة وتقليل كمية البيانات المخزنة، والحد من الوقت للتصنيف، والذي قضى على اختيار المعايير التالية.

استخدام عينات كبيرة جدا

ويستند أقرب طريقة جار على تخزين الحقيقي للكائنات التعلم. لإنشاء جدا العينات على نطاق واسع باستخدام مشكلة فنية. والهدف من ذلك هو ليس فقط لتوفير كمية كبيرة من المعلومات، ولكن أيضا في الحد الأدنى من الوقت لديهم الوقت للعثور على أي كائن ش ك بين أقرب الجيران.

للتعامل مع هذه المهمة، وتستخدم طريقتين:

  • عينة ضعيفة من خلال الكائنات غير بيانات التفريغ.
  • استخدام بنية بيانات خاص فعال ورموز للبحث الفوري لأقرب الجيران.

قواعد وطرق اختيار

واعتبر التصنيف أعلاه. يستخدم أقرب طريقة الجيران في حل المشاكل العملية، والذي يعرف مقدما المسافة وظيفة \ رو (س، س '). في كائنات واصفا استخدام ناقلات الرقمية مقياس الإقليدية. هذا الخيار له أي مبرر خاص، ولكن ينطوي على قياس جميع علامات "في نفس النطاق." إذا لم يتم اتخاذ هذا العامل في الاعتبار، ثم متري سوف تسود ميزة وجود أعلى القيم الرقمية.

إذا كان هناك كمية كبيرة من الميزات، وحساب المسافة كمجموع الانحرافات على أعراض محددة تظهر البعد مشكلة خطيرة.

في الفضاء الأبعاد عالية بعيدة عن بعضها البعض فإن كل الكائنات. في نهاية المطاف، فإن أي عينة تكون إلى جانب الكائن قيد الدراسة ك الجيران. اختيار عدد قليل من ميزات مفيدة للقضاء على هذه المشكلة. خوارزميات لحساب التقديرات بناء على أساس مجموعات مختلفة من الإشارات، ولكل فرد وظيفة بناء قربها.

استنتاج

غالبا ما تنطوي على عمليات حسابية استخدام مجموعة متنوعة من التقنيات التي لها خصائص مميزة خاصة بهم، مزايا وعيوب. ينظر أقرب طريقة الجيران يمكن أن تحل تماما مشكلة خطيرة، نظرا لخصائص الأجسام الرياضية. يتم استخدام مفهوم التجريبي، استنادا إلى أسلوب تحليل بنشاط في مجال الذكاء الاصطناعي.

في النظم الخبيرة أنه من الضروري ليس فقط لتصنيف الأشياء، ولكن أيضا تظهر للمستخدم تفسيرا للتصنيف في السؤال. في هذه الطريقة، يتم التعبير تفسيرا لهذه الظاهرة فيما يتعلق كائن من فئة معينة وكذلك موقعها بالنسبة للعينة المستخدمة. المختصين في هذا المجال القانوني والجيولوجيين والأطباء، وتأخذ هذه "سابقة" منطق استخدامها بنشاط في أبحاثهم.

من أجل تحليلها وطريقة الأكثر موثوقية وكفاءة، وإعطاء النتائج المرجوة، يجب أن تأخذ الرقم الحد الأدنى للك، في حين أيضا تجنب انبعاثات بين الكائنات تحليلها. هذا هو السبب في استخدام المعايير وطريقة الاختيار، وكذلك المقاييس الأمثل.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ar.atomiyme.com. Theme powered by WordPress.