Как еще можно использовать метод наименьших квадратов?

Методом наименьших квадратов (МНК) называют метод оценки величин по результатам множества измерений, содержащим случайные ошибки.

Суть метода заключается в том, что критерием качества рассматриваемого решения является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше — тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.

Почему сводятся к минимуму квадраты ошибок, а не сами ошибки? Дело в том, что в большинстве случаев ошибки бывают в обе стороны: оценка может быть больше измерения или меньше его. Если складывать ошибки с разными знаками, то они будут взаимно компенсироваться, и в итоге сумма даст нам неверное представление о качестве оценки. Часто для того, чтобы итоговая оценка имела ту же размерность, что и измеряемые величины, из суммы квадратов ошибок извлекают квадратный корень.

МНК используется в математике, в частности — в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК — решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.

Я придумал ещё несколько весьма неожиданных областей применения МНК, о которых хотел бы рассказать в этой статье. МНК и опечатки

Бичом автоматических переводчиков и поисковых систем являются опечатки и орфографические ошибки. Действительно, если слово отличается всего на 1 букву, программа расценивает его уже как другое слово и переводит/ищет его неправильно или не переводит/не находит его вообще.

У меня возникла похожая проблема — имелось две базы данных с адресами московских домов, и надо было их объединить в одну. Но адреса были записаны в разном стиле: в одной базе был стандарт КЛАДР (всероссийский классификатор адресов), например «БАБУШКИНА ЛЕТЧИКА УЛ., Д10К3», а в другой базе был почтовый стиль, например: «Ул. Летчика Бабушкина, дом 10 корп. 3». Вроде бы ошибок нет в обоих случаях, а автоматизировать процесс невероятно сложно (в каждой базе по 40 тысяч записей!). Хотя и опечаток там тоже хватало… Как дать компьютеру понять, что 2 вышеприведённых адреса принадлежат одному и тому же дому? Тут-то мне и пригодился МНК.

Что я сделал? Найдя очередную букву в первом адресе, я искал ту же букву во втором адресе. Если они обе находились на одном и том же месте, то я полагал ошибку для этой буквы равной 0. Если они располагались на соседних позициях, то ошибка была равна 1, если имелся сдвиг на 2 позиции, ошибка равнялась 2 и т. д. Если такой буквы вообще не имелось в другом адресе, то ошибка полагалась равной n+1, где n — число букв в 1-м адресе. Таким образом, я вычислял сумму квадратов ошибок и соединял те записи, в которых эта сумма была минимальной.

Разумеется, номера домов и корпусов обрабатывались отдельно. Не знаю, изобрёл ли я очередной «велосипед», но задача была решена быстро и качественно. Интересно, применяется ли этот метод в поисковых системах? Возможно, применяется, поскольку каждый уважающий себя поисковик при встрече незнакомого слова предлагает замену из знакомых слов («возможно вы имели в виду…»). Впрочем, они могут делать этот анализ как-то по-другому. МНК и поиск по картинкам, лицам и картам

Этот метод можно применить и в поиске по картинкам, чертежам, картам и даже по лицам людей.

Сейчас все поисковики, вместо поиска по картинкам, по сути используют поиск по подписям к картинкам. Это, несомненно, полезный и удобный сервис, но я предлагаю дополнить его настоящим поиском по картинкам. Вводится картинка-образец, и для всех изображений составляется рейтинг по сумме квадратов отклонений характерных точек. Определение этих самых характерных точек есть сама по себе нетривиальная задача. Однако она вполне решаема: например, для лиц это уголки глаз, губ, кончик носа, ноздри, края и центры бровей, зрачки и т. д.

Сопоставив эти параметры, можно найти лицо, наиболее похожее на образец. Я уже видел сайты, где такой сервис работает, и вы можете найти знаменитость, наиболее похожую на предложенную вами фотографию и даже составить анимацию, превращающую вас в знаменитость и обратно. Наверняка, этот же метод работает в базах МВД, содержащих фотороботы преступников.

Да и по отпечаткам пальцев можно тем же методам делать поиск. Поиск по картам ориентируется на естественные неровности географических объектов — изгибы рек, горных хребтов, очертания берегов, лесов и полей.

Вот такой замечательный и универсальный метод МНК. Я уверен, что вы, дорогие читатели, сможете и сами найти множество необычных и неожиданных областей применения этого метода.

Автор статьи: неизвестный | Дата публикации: 22:35 24.03.2017 Actualdaily.Ru




Отзывы и комментарии
Ваше имя (псевдоним):
Проверка на спам:

Введите символы с картинки:



Курить или не курить? Вот в чем вопрос!

Курить или не курить? Вот в чем вопрос!


В который раз встречаюсь с этой дилеммой. Хорошо еще, что она возникает не у меня в голове — я-то давно для себя все решил! А теперь и вам помочь хочу. Вы мне расскажете о вреде курения, а ...


«Таврия» уходит в историю… Какой была самая украинская легковушка?

«Таврия» уходит в историю… Какой была самая у...


«В конце января 2011 года с заводского конвейера сошел последний автомобиль марки „Славута“. Теперь украинский автопром будет заниматься исключительно сборкой иностранных „легк...


Литература и электронные книги

Литература и электронные книги


С каждым днем все больше и больше пользователей интернета переходят на чтение книг в электронном формате, доступность литературы в сетях интернета огромна, последнее время сеть испытывает наплыв больш...


Как бесплатно получить обратные ссылки

Как бесплатно получить обратные ссылки


Обратные ссылки являются важным фактором в SEO и используются при ранжировании сайта в результатах поиска. Сегодня большая значимость обратных ссылок привела к тому, что многие владельцы сайтов покупа...


Какую микроволновку выбрать

Какую микроволновку выбрать


     Микроволновые печи давно и уверенно вошли в нашу повседневную жизнь. Они облегчают приготовление и подогрев наших блюд.      За все время существования СВЧ-печей ...


Как Вы разговариваете со своим ребенком? Привычные ответы

Как Вы разговариваете со своим ребенком? Прив...


Как ни странно, но зачастую причиной плохого поведения ребенка являются… сами родители! Послушайте при случае, как разговаривают мамы с детьми на детской площадке, в автобусе или в магазине. &l...


Популярное

Зависит ли стоимость часов от зарплаты владельца?

Наручные часы — неизменный атрибут мужского имиджа, который может многое рассказать об общественном статусе владельца. Баснословно дорогие модели легендарных брендов украшают запястья видны...

Продвижение сайтов, интернет-реклама

На данный момент наиболее популярными считаются поисковые системы Google, Yandex, Rambler и Aport. Продвижение сайта – это комплекс мероприятий направленный на увеличение количества посетителей, путем...

Материалы для быстрого обустройства и ремонта офис

Ремонт старого офиса или переезд в новые помещения – без преувеличения, тяжелейшее испытание для любой компании. Грязь, пыль, шум – вот далеко не полный список неизбежных проблем, которые становятся п...

Новинки кино. Что смотреть в выходные 6-7 ноября?

Длинные праздничные выходные, включающие в себя как новые, еще толком не принятые народом праздники, так и старые, проверенные временем, могут стать для российских кинотеатров весьма прибыльными. А мо...

История возникновения московского такси

Сегодня уже сложно представить Москву без многочисленного транспорта различного вида, среди которого можно увидеть такси различных видов, размеров и марок. Но ведь это было не всегда так, а в какой-то...

Развивающий коврик для малыша: как его сделать сво

Нынче основательно вошли в обиход всяческие развивающие игрушки для самых маленьких. Кубики, коврики, мячики, домики. Причем стоит все это удовольствие весьма недешево. Ну то есть те же домики и ...

К какому удивительному событию привел отказ Наполе

Среди декабристов одним из самых прославленных участников войн с Наполеоном был генерал Михаил Александрович Фонвизин. К моменту восстания на Сенатской площади он давно отошел от активного участия в т...

Ульф Лукан. Лекция: Психология зависти.

Ульф Лукан, доц. каф. педагогической психологии университет Карл Франценс (Австрия).Лекция: Психология завистиРегуляторная система формируется в тот период, когда ребенок общается с матерью, и все зд...

Наливные полы в доме

Наверняка все слышали, что полы настилаются. Но о том, что их можно еще наливать знают не многие. «Наливной пол» или как его еще называют жидкий линолеум – так называется покрытие для пола. Между обыч...

Игрокам нужно чаще расслабляться

На американских официальных форумах MMORPG World Of Warcraft от компании Blizzard Entertainment не утихают философские споры о сути игры и того, что в ней делают пользователи. Так, один из игроков под...

Новости развития информационнного портала:

Наш портал является ресурсом, который включает в себя широкий ассортимент познавательных и отличных статей. Каждый гость отыщет для себя что-нибудь полезное. Современный дизайн позволяет вам моментально находить нужную информацию. Самые разнообразные тематические статьи дают возможность вам совершенствоваться в той или иной сфере. Быть более начитанным и грамотным. Современный дизайн сайта позволяет просматривать статьи на всех существующих планшетах. Теперь найти нужную информацию стало совершенно просто.

Мы подобрали для вас полезные и занимательные статьи. У нас сайте вы найдете ответы на интересующие вас вопросы. Простая система поиска позволяет вам в кратчайшие сроки отыскать нужную информацию. Адаптированный дизайн позволяет вам просматривать информацию на любых гаджетах. Теперь, поиск требуемой информации будет занимать у вас секунды.