Интересные факты

Как это работает? | Компьютерное зрение

Будто самостоятельная дисциплина компьютерное зрение зародилось в начале 50-х годов прошлого века. В 1951 году Джон поле Нейман предложил анализировать микроснимки при помощи компьютеров путём сравнения яркости соседних частей изображения. В 60-е годы начались исследования в области распознавания машинного и рукописного текста. Тогда же были сделаны первые попытки моделирования нейронной сети. Первым устройством, способным распознавать буквы, стала разработка Фрэнка Розенблатта — персептроном. А в 70-х годах ученые стали учить зрительную систему человека с целью её формализации и реализации в виде алгоритмов. Подобный подход был призван позволить распознавать объекты на изображениях. Будто же работает современное компьютерное зрение – об этом в сегодняшнем выпуске.

Итак, компьютерное зрение — это комплект методов, позволяющих обучить машину извлекать информацию из изображения или видео. Чтоб компьютер находил на изображениях определенные объекты, его необходимо научить. Для этого составляется огромная обучающая выборка, так, из фотографий, часть из которых содержат искомый объект, а другая доля — напротив, не содержит. Дальше в дело вступает машинное обучение. Компьютер анализирует изображения из выборки, определяет, какие признаки и их комбинации указывают на присутствие искомых объектов, и просчитывает их значимость.

После завершения обучения компьютерное зрение можно применять в деле. Для компьютера изображение — это комплект пикселей, у каждого из которых кушать своё значение яркости или цвета. Чтоб машина смогла получить понятие о содержимом картинки, ее обрабатывают с помощью специальных алгоритмов. Вначале выявляют потенциально значимые места. Это можно мастерить несколькими способами. Например, исходное изображение несколько один подвергают размытию по Гауссу, используя различный радиус размытия. Затем результаты сравнивают товарищ с другом. Это позволяет выявить наиболее контрастные фрагменты — яркие пятна и изломы линий.

Похожие новости  10 удивительных суперспособностей новорожденных

После того будто значимые места найдены, компьютер описывает их в числах. Запись фрагмента картинки в числовом виде называется дескриптором. С помощью дескрипторов можно довольно точно сравнивать фрагменты изображения без использования самих фрагментов. Чтоб ускорить вычисления, компьютер проводит кластеризацию или распределение дескрипторов по группам. В одинешенек и тот же кластер попадают похожие дескрипторы с разных изображений. После кластеризации важным становится лишь номер кластера с дескрипторами, наиболее похожими на этот. Переход от дескриптора к номеру кластера называется квантованием, а сам номер кластера — квантованным дескриптором. Квантование существенно сокращает объём данных, которые необходимо обработать компьютеру.

Опираясь на квантованные дескрипторы, компьютер может сравнивать изображения и распознавать на них объекты. Он сопоставляет наборы квантованных дескрипторов с разных изображений и делает вывод о том, как они или их отдельные фрагменты похожи. Такое сравнение в том числе используется поисковыми системами для поиска по загруженной картинке.

Hi-News.ru — Новости высоких технологий.

Добавить комментарий