Как еще можно использовать метод наименьших квадратов?

Методом наименьших квадратов (МНК) называют метод оценки величин по результатам множества измерений, содержащим случайные ошибки.

Суть метода заключается в том, что критерием качества рассматриваемого решения является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше — тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.

Почему сводятся к минимуму квадраты ошибок, а не сами ошибки? Дело в том, что в большинстве случаев ошибки бывают в обе стороны: оценка может быть больше измерения или меньше его. Если складывать ошибки с разными знаками, то они будут взаимно компенсироваться, и в итоге сумма даст нам неверное представление о качестве оценки. Часто для того, чтобы итоговая оценка имела ту же размерность, что и измеряемые величины, из суммы квадратов ошибок извлекают квадратный корень.

МНК используется в математике, в частности — в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК — решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.

Я придумал ещё несколько весьма неожиданных областей применения МНК, о которых хотел бы рассказать в этой статье. МНК и опечатки

Бичом автоматических переводчиков и поисковых систем являются опечатки и орфографические ошибки. Действительно, если слово отличается всего на 1 букву, программа расценивает его уже как другое слово и переводит/ищет его неправильно или не переводит/не находит его вообще.

У меня возникла похожая проблема — имелось две базы данных с адресами московских домов, и надо было их объединить в одну. Но адреса были записаны в разном стиле: в одной базе был стандарт КЛАДР (всероссийский классификатор адресов), например «БАБУШКИНА ЛЕТЧИКА УЛ., Д10К3», а в другой базе был почтовый стиль, например: «Ул. Летчика Бабушкина, дом 10 корп. 3». Вроде бы ошибок нет в обоих случаях, а автоматизировать процесс невероятно сложно (в каждой базе по 40 тысяч записей!). Хотя и опечаток там тоже хватало… Как дать компьютеру понять, что 2 вышеприведённых адреса принадлежат одному и тому же дому? Тут-то мне и пригодился МНК.

Что я сделал? Найдя очередную букву в первом адресе, я искал ту же букву во втором адресе. Если они обе находились на одном и том же месте, то я полагал ошибку для этой буквы равной 0. Если они располагались на соседних позициях, то ошибка была равна 1, если имелся сдвиг на 2 позиции, ошибка равнялась 2 и т. д. Если такой буквы вообще не имелось в другом адресе, то ошибка полагалась равной n+1, где n — число букв в 1-м адресе. Таким образом, я вычислял сумму квадратов ошибок и соединял те записи, в которых эта сумма была минимальной.

Разумеется, номера домов и корпусов обрабатывались отдельно. Не знаю, изобрёл ли я очередной «велосипед», но задача была решена быстро и качественно. Интересно, применяется ли этот метод в поисковых системах? Возможно, применяется, поскольку каждый уважающий себя поисковик при встрече незнакомого слова предлагает замену из знакомых слов («возможно вы имели в виду…»). Впрочем, они могут делать этот анализ как-то по-другому. МНК и поиск по картинкам, лицам и картам

Этот метод можно применить и в поиске по картинкам, чертежам, картам и даже по лицам людей.

Сейчас все поисковики, вместо поиска по картинкам, по сути используют поиск по подписям к картинкам. Это, несомненно, полезный и удобный сервис, но я предлагаю дополнить его настоящим поиском по картинкам. Вводится картинка-образец, и для всех изображений составляется рейтинг по сумме квадратов отклонений характерных точек. Определение этих самых характерных точек есть сама по себе нетривиальная задача. Однако она вполне решаема: например, для лиц это уголки глаз, губ, кончик носа, ноздри, края и центры бровей, зрачки и т. д.

Сопоставив эти параметры, можно найти лицо, наиболее похожее на образец. Я уже видел сайты, где такой сервис работает, и вы можете найти знаменитость, наиболее похожую на предложенную вами фотографию и даже составить анимацию, превращающую вас в знаменитость и обратно. Наверняка, этот же метод работает в базах МВД, содержащих фотороботы преступников.

Да и по отпечаткам пальцев можно тем же методам делать поиск. Поиск по картам ориентируется на естественные неровности географических объектов — изгибы рек, горных хребтов, очертания берегов, лесов и полей.

Вот такой замечательный и универсальный метод МНК. Я уверен, что вы, дорогие читатели, сможете и сами найти множество необычных и неожиданных областей применения этого метода.


22:35 24.03.2017



Отзывы и комментарии
Ваше имя (псевдоним):
Проверка на спам:

Введите символы с картинки:



Вкусные рецепты: Тирамису, Торт "Дерево под снегом", Шарлотка "Экономная"

Вкусные рецепты: Тирамису, Торт "Дерево под сне...

ТирамисуНеобходимый набор для нашего конструктора Желтки смешать с 250 гр сахара, добавить 20 гр ванильного сахара и взбивать миксором до однородного состояния минут 10 - 12 К получившейся массе добав...
Сдача лома цветных металлов: как можно сделать это выгодно?

Сдача лома цветных металлов: как можно сделать это в...

Лом цветных металлов находится в изделиях кабельной продукции, неисправных приборах и оборудовании, а также в их составных частях. К наиболее востребованным металлам относятся нержавейка, медь, магний...
Приспособления для производства: как выбрать подходящего поставщика?

Приспособления для производства: как выбрать подходя...

Необходим софтстартер, преобразователь частоты или какое-либо другое электротехническое устройство для промышленности? В какой бы нише вы ни трудились, рано или поздно будете переживать об эффективнос...
Веб-аналитика

Веб-аналитика

Независимо от того, что представляет собой ваш сайт, будь-то глобальный интернет-портал, небольшой блог, корпоративный проект или сетевой магазин, веб-аналитика проведёт аудит сайта и расскажет о том,...
14 ноября: Кузьминки! Как веселились наши предки?

14 ноября: Кузьминки! Как веселились наши предки?

На 14 ноября приходится день почитания православных святых Космы и Дамиана, родных братьев и лекарей-чудотворцев из малоазийской Асии, что жили еще в III веке и прославились как бескорыстные цели...
Народная медицина: исцеление пчелиным подмором, ядом, пергой

Народная медицина: исцеление пчелиным подмором, ядом...

О полезных свойствах продуктов пчеловодства всем было известно еще в Средневековье. В нетрадиционной медицине даже родилось новое направление – апитерапия. Тема нашей сегодняшней публикации – лечение ...
Может заинтересовать

Ионизаторы воды: Канген Вода - читайте отзывы на k

Любой человек нуждается в регулярном употреблении полезной воды, которая не только отлично утоляет ж...

Первые сигналы заражения СПИДом: как можно понять,

СПИД – заболевание нашей эпохи. И если человеческое общество научилось справляться со многими ...

Как прославиться на «Школе Жизни»? В поисках Лох-Н

Как повстречаться с Лох-Несским чудовищем? Предположим, вы из Тамбова. Покупаем билет на поезд до М...

Профессиональный таможенный юрисконсульт: все виды

В нашей жизни могут произойти ситуации, когда нужно направиться за поддержкой в правовые организации...

Отделка фасадов трехслойными стеновыми панелями

Опытные бизнесмены прекрасно знают, что в деле успешного продвижения компании и получения прибыли ва...

Что такое тонир?

Для каждого армянина лаваш — это символ Армении. Лаваш пекут в тонире. Что же такое ...

С чего начинается хороший интерьер? Секреты профес

Данная статья адресована всем, кто хочет создать стильный современный и в то же время неповторимый и...

О предполагаемом единстве сил согласно современной

О ПРЕДПОЛАГАЕМОМ ЕДИНСТВЕ СИЛ ПРИРОДЫ СОГЛАСНО СОВРЕМЕННОЙ НАУКЕ И ВООБРАЖАЕМЫХ УЧЕНЫМИ ЭНЕРГИЯХ (пр...

Чему учат «бесплатные» онлайн-игры?

Сразу оговорюсь — в данной статье речь не идет о таких играх, как шашки, шахматы и т. д. ...

Истина в вине? Истоки виноделия

Алкоголь в малых дозах безвреден в любом количестве. (М. Жванецкий) А известно ли Тебе, Уважаем...



Новости развития информационнного портала:

Наш портал является ресурсом, который включает в себя широкий ассортимент познавательных и отличных статей. Каждый гость отыщет для себя что-нибудь полезное. Современный дизайн позволяет вам моментально находить нужную информацию. Самые разнообразные тематические статьи дают возможность вам совершенствоваться в той или иной сфере. Быть более начитанным и грамотным. Современный дизайн сайта позволяет просматривать статьи на всех существующих планшетах. Теперь найти нужную информацию стало совершенно просто.

Мы подобрали для вас полезные и занимательные статьи. У нас сайте вы найдете ответы на интересующие вас вопросы. Простая система поиска позволяет вам в кратчайшие сроки отыскать нужную информацию. Адаптированный дизайн позволяет вам просматривать информацию на любых гаджетах. Теперь, поиск требуемой информации будет занимать у вас секунды.