Как еще можно использовать метод наименьших квадратов?

Методом наименьших квадратов (МНК) называют метод оценки величин по результатам множества измерений, содержащим случайные ошибки.

Суть метода заключается в том, что критерием качества рассматриваемого решения является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше — тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.

Почему сводятся к минимуму квадраты ошибок, а не сами ошибки? Дело в том, что в большинстве случаев ошибки бывают в обе стороны: оценка может быть больше измерения или меньше его. Если складывать ошибки с разными знаками, то они будут взаимно компенсироваться, и в итоге сумма даст нам неверное представление о качестве оценки. Часто для того, чтобы итоговая оценка имела ту же размерность, что и измеряемые величины, из суммы квадратов ошибок извлекают квадратный корень.

МНК используется в математике, в частности — в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК — решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.

Я придумал ещё несколько весьма неожиданных областей применения МНК, о которых хотел бы рассказать в этой статье. МНК и опечатки

Бичом автоматических переводчиков и поисковых систем являются опечатки и орфографические ошибки. Действительно, если слово отличается всего на 1 букву, программа расценивает его уже как другое слово и переводит/ищет его неправильно или не переводит/не находит его вообще.

У меня возникла похожая проблема — имелось две базы данных с адресами московских домов, и надо было их объединить в одну. Но адреса были записаны в разном стиле: в одной базе был стандарт КЛАДР (всероссийский классификатор адресов), например «БАБУШКИНА ЛЕТЧИКА УЛ., Д10К3», а в другой базе был почтовый стиль, например: «Ул. Летчика Бабушкина, дом 10 корп. 3». Вроде бы ошибок нет в обоих случаях, а автоматизировать процесс невероятно сложно (в каждой базе по 40 тысяч записей!). Хотя и опечаток там тоже хватало… Как дать компьютеру понять, что 2 вышеприведённых адреса принадлежат одному и тому же дому? Тут-то мне и пригодился МНК.

Что я сделал? Найдя очередную букву в первом адресе, я искал ту же букву во втором адресе. Если они обе находились на одном и том же месте, то я полагал ошибку для этой буквы равной 0. Если они располагались на соседних позициях, то ошибка была равна 1, если имелся сдвиг на 2 позиции, ошибка равнялась 2 и т. д. Если такой буквы вообще не имелось в другом адресе, то ошибка полагалась равной n+1, где n — число букв в 1-м адресе. Таким образом, я вычислял сумму квадратов ошибок и соединял те записи, в которых эта сумма была минимальной.

Разумеется, номера домов и корпусов обрабатывались отдельно. Не знаю, изобрёл ли я очередной «велосипед», но задача была решена быстро и качественно. Интересно, применяется ли этот метод в поисковых системах? Возможно, применяется, поскольку каждый уважающий себя поисковик при встрече незнакомого слова предлагает замену из знакомых слов («возможно вы имели в виду…»). Впрочем, они могут делать этот анализ как-то по-другому. МНК и поиск по картинкам, лицам и картам

Этот метод можно применить и в поиске по картинкам, чертежам, картам и даже по лицам людей.

Сейчас все поисковики, вместо поиска по картинкам, по сути используют поиск по подписям к картинкам. Это, несомненно, полезный и удобный сервис, но я предлагаю дополнить его настоящим поиском по картинкам. Вводится картинка-образец, и для всех изображений составляется рейтинг по сумме квадратов отклонений характерных точек. Определение этих самых характерных точек есть сама по себе нетривиальная задача. Однако она вполне решаема: например, для лиц это уголки глаз, губ, кончик носа, ноздри, края и центры бровей, зрачки и т. д.

Сопоставив эти параметры, можно найти лицо, наиболее похожее на образец. Я уже видел сайты, где такой сервис работает, и вы можете найти знаменитость, наиболее похожую на предложенную вами фотографию и даже составить анимацию, превращающую вас в знаменитость и обратно. Наверняка, этот же метод работает в базах МВД, содержащих фотороботы преступников.

Да и по отпечаткам пальцев можно тем же методам делать поиск. Поиск по картам ориентируется на естественные неровности географических объектов — изгибы рек, горных хребтов, очертания берегов, лесов и полей.

Вот такой замечательный и универсальный метод МНК. Я уверен, что вы, дорогие читатели, сможете и сами найти множество необычных и неожиданных областей применения этого метода.


22:35 24.03.2017



Отзывы и комментарии
Ваше имя (псевдоним):
Проверка на спам:

Введите символы с картинки:



Великое стояние на Угре. Как это было?

Великое стояние на Угре. Как это было?

530 лет назад, в 1480 году, произошло одно из самых знаменательных событий, которое существенно повлияло на дальнейший ход истории нашей Родины, — Великое стояние на Угре. В чём же зн...
Советы опытных людей по приобретению мебели для детской комнаты.

Советы опытных людей по приобретению мебели для детс...

Уверен, что Вы не будете спорить с тем, что для любого из нас личный дом – это надежная крепость и поддержка, туда хочется возвращаться после напряженного будничного дня. В его стенах легко забыть нас...
Закачать лучшие онлайн-игры на Андроид без регистрации - неплохой выбор для собственников смартфонов!

Закачать лучшие онлайн-игры на Андроид без регистрац...

В данный момент можно найти немало веб-сайтов, которые посвящены ОС Android. Данная операционная система считается расширяемой платформой, что дает программистам богатейшие пространства для реализации...
Магниты оптом: как отыскать добросовестного поставщика?

Магниты оптом: как отыскать добросовестного поставщи...

Неодимовые магниты используются в различных сферах. К примеру, в быту они применяются для поиска предметов из металла, а в промышленности – для производства фильтров, креплений и многого другого. Есл...
Необычное знакомство

Необычное знакомство

     История, описанная здесь, произошла в одном из дачных поселков недалеко от Москвы. Было начало сентября - время, когда большинство москвичей уже покинули свои загородные ...
Проблемы обучения

Проблемы обучения

Вы когда-нибудь размышляли о том, почему люди, начиная с воодушевлением изучать какой-либо предмет или курс, через некоторое время хотят его бросить? Почему, читая книгу, и дойдя до конца страницы, че...
Читаемые

А аренда всё-таки выгоднее

Одним из условий успешной работы современного бизнес-центра является безукоризненный имидж и высокок...

Самая большая хакерская атака года. Взлом социальн

Сегодня из средств массовой информации мы узнали о взломе социальной сети «В контакте». Из комментар...

О выборе гроба для погребения и других ритуальных

Ритуальные товары Гроб для захоронения покойного надолго остается в памяти после прощания ним. В ег...

Настройка jimm. Беседуйте в сети комфортно.

Казалось бы, совсем немного времени тому назад появились самые новые устройства для коммуникации, вк...

Без памяти нет традиций

Так начался семинар педагогических работников "Традиции, обычаи, образы русской народной культу...

Сотовый полипропилен

Полипропиленовые листы производятся из полимерного сырья по технологии выдавливания - экструзии. Исх...

Математическое программирование

Современное народное хозяйство — сложная система, состоящая из множества взаимосвязанных экономическ...

Всё о метатегах

Метатеги – это теги веб-страницы, которые содержат информацию о её свойствах и содержимом. С помощь...

Веб дизайн для продвижения сайтов

Любой пользователь Сети, решивший создать свой проект, должен прекрасно понимать, что дизайн сайта я...

Как граф Хвостов стал «королем графоманов»? Часть

Шут Однако ни графский титул, ни рассылка произведений сами по себе не смогли бы вписать имя Х...



О портале:

Наш портал является ресурсом, который включает в себя широкий ассортимент познавательных и отличных статей. Каждый гость отыщет для себя что-нибудь полезное. Современный дизайн позволяет вам моментально находить нужную информацию. Самые разнообразные тематические статьи дают возможность вам совершенствоваться в той или иной сфере. Быть более начитанным и грамотным. Современный дизайн сайта позволяет просматривать статьи на всех существующих планшетах. Теперь найти нужную информацию стало совершенно просто.

Мы подобрали для вас полезные и занимательные статьи. У нас сайте вы найдете ответы на интересующие вас вопросы. Простая система поиска позволяет вам в кратчайшие сроки отыскать нужную информацию. Адаптированный дизайн позволяет вам просматривать информацию на любых гаджетах. Теперь, поиск требуемой информации будет занимать у вас секунды.