ФормирањеСредното образование и училишта

Најблиската метод сосед: пример на работа

најблискиот сосед метод е најлесниот метрички класификатор кој се базира на оценка на сличноста на различни предмети.

Анализирано предметот му припаѓа на класата на која тие припаѓаат предмети на примерокот обука. Дозволете ни да дознаете кој е најблизок сосед. Обидете се да се разбере комплицирано прашање, примери на различни техники.

метод хипотеза

најблискиот сосед метод може да се смета како најчеста алгоритам се користи за класификација. Објект во процес на класификација припаѓа y_i класата, на која најблиску објект учење x_i примерок.

Специфичност на методи најблиски соседи

k најблиската метод сосед може да се подобри точноста на класификација. Анализирано предметот му припаѓа на истата класа како дел од своите соседи, што е, к блиску до него се спротивставува на анализираните примероци x_i на. Во решавањето на проблемите со две класи на бројот на соседите ќе биде чудно да се избегне ситуација на двосмисленоста, ако истиот број на соседи ќе припаѓаат на различни класи.

Техниката на суспендирани соседи

PostgreSQL анализирани метод tsvector најблиски соседи се користи кога бројот на часови најмалку три, а вие не може да се користи непарен број. Но, двосмисленоста јавува дури и во овие случаи. Потоа, i-тиот сосед добива w_i тежина, со што се намалува со соседот ранг i. Тоа се однесува на класа на објектот, кој ќе има максимална вкупна тежина меѓу блиски соседи.

Хипотезата на компактноста

Во срцето на сите од горенаведените методи е хипотезата за компактност. Тоа укажува на врската помеѓу мерка за сличност на објектите и нивната припаѓаат на иста класа. Во оваа ситуација, на границата помеѓу различните видови е едноставна форма, и да се создаде класи на објекти во вселената компактен мобилен област. Во такви области во математичката анализа се подразбираат затворен граничи сет. Оваа хипотеза не е поврзано со секојдневниот перцепција на зборот.

Основната формула

Дозволете ни да се испита повеќе најблизок сосед. Ако предложената обука примерок тип "објектно-одговор» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; ако множество на објекти да се дефинира растојанието функција \ rho (x, x "), која е претставена во форма на соодветен модел сличноста на објекти со зголемување на вредноста на функција се намалува сличност меѓу предметите x, x '.

За било кој објект, у ќе се изгради примерок обука објекти x_i со зголемување на растојанија до u:

\ Rho (u, x_ {1; u}) \ Leq \ Rho (u, x_ {2; u}) \ Leq \ cdots \ Leq \ Rho (u, x_ {m; u}),

каде што x_ {i; U} карактеризира примерок на учење објект, кој е i-тиот сосед извор објект u. Таквите нотација и употреба за да одговорите на i-тиот сосед: y_ {i; u}. Како резултат на тоа, сметаме дека секој предмет u провоцира renumbering свој примерок.

Одредување на бројот k од соседите

Најблиската метод сосед кога k = 1 е способен да дава погрешна класификација, не само на објекти-емисии, но исто така и за други класи кои се во близина.

Ако го земеме k = m, алгоритам ќе биде како стабилна и ќе прерасне во константна вредност. Тоа е причината зошто сигурност е важно да се избегне екстремни индекси k.

Во пракса, како што се користи оптимален индекс k критериум лизгачка контрола.

емисиите на проекции

Предметите на студии се во голема мера нееднакви, но меѓу нив има и такви кои имаат карактеристики на една класа и се нарекуваат стандарди. Во близина на предметот на идеален модел за неговата висока веројатност за кои припаѓаат на оваа класа.

Како rezultativen метод на најблиски соседи? Еден пример може да се види врз основа на периферни и не-информативни категории на објекти. Се претпоставува густа средина на објектот други претставници на оваа класа. Кога ќе ги извадите од класификацијата за тестирање на квалитетот нема да страдаат.

Добие во одреден број на примероци може да пукне на бучава кои се "на теренот" на една класа. Отстранување значително позитивно влијание врз квалитетот на класификација.

Ако примерокот земен од неинформативни и да ги елиминираат бучавата објекти, може да смета на неколку позитивни резултати во исто време.

Првиот метод интерполација на најблискиот сосед класификација овозможува да се подобри квалитетот, намалување на износот на складирани податоци, намалување на времето на класификација, која се потроши на изборот на следниот стандарди.

Употребата на ултра-големи примероци

најблискиот сосед метод е базиран на вистински складирање на учење објекти. Да се создаде многу големи примероци користејќи технички проблем. Целта не е само да се спаси значителен износ на информации, но исто така и во најмалку износот на време да се има време да се најде било кој објект у к меѓу најблиските соседи.

Да се справат со оваа задача, се користат две методи:

  • Слаб примерок преку објекти празнење не-податоци;
  • ефикасно користење посебна структура на податоците и кодови за инстант пребарување на најблиски соседи.

Правила за методи на избор

Горенаведените класификација се сметаше. Најблискиот сосед метод се користи за решавање на практични проблеми, кои однапред се знае функцијата \ ро растојание (x, x). Во опишувањето објекти нумерички вектори користи Евклидова метрика. Овој избор нема посебно оправдување, но вклучува мерење на сите знаци "во истиот обем." Ако овој фактор не е земена во предвид, тогаш метрички ќе доминираат функција има највисок нумерички вредности.

Ако постои значителна количина на функции, се пресметува растојанието како збир на отстапувањата на специфични симптоми се појави сериозна димензија на проблемот.

Во средно димензионален простор оддалечени една од друга ќе се сите предмети. На крајот на краиштата, секој примерок ќе биде во близина на објектот се изучува к соседи. избрани мал број на информативни функции, за да се елиминира овој проблем. Алгоритми за пресметување проценки се изгради врз основа на различни групи на знаци, и за секој поединец да се изгради нивната близина функција.

заклучок

Математички пресметки често вклучуваат употреба на различни техники кои имаат свои посебни карактеристики, предности и недостатоци. Гледано најблискиот сосед метод може да се реши прилично сериозен проблем, поради карактеристиките на математичките објекти. Експерименталната концепт, врз основа на анализираните метод се користи активно во вештачката интелигенција.

Во експертски системи, неопходно е не само да се класифицираат објекти, но, исто така, покажуваат корисникот објаснување за пласман во прашање. Во овој метод, објаснување на овој феномен се изразени во однос на предметот на одредена класа, како и нејзината локација во однос на примерокот. Правни индустријата специјалисти, геолози, лекарите, земи го ова "преседан" логика активно го користат во своите истражувања.

Со цел да се анализираат метод е најстариот сигурен, ефикасен, давајќи им на саканите резултати, ќе мора да се минимум фигура k, а во исто време да избегнуваат емисии меѓу анализираните предмети. Тоа е причината зошто употребата на стандардите и начинот на избор, како и метрика на оптимизација.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 mk.atomiyme.com. Theme powered by WordPress.