Нет ничего проще, чем распознать руку в сжатом кулаке, но для вычислительного устройства, «думающего» алгоритмически, пятерня и кулак — формально разные объекты, процесс распознавания которых выливается в запутанную и нетривиальную процедуру с вероятностным исходом, не всегда приемлемым, если цена ошибки является критичной (например, при различении опухолей и нормальных тканей в трехмерной томографии или пешехода и мотоциклиста при автонавигации в условиях городской среды).
Даже независимо от того, что скажет нейрофизиология о представлении и обработке визуальной информации в мозгу (хотя в дальнейшем и такая информация может оказаться важной), интуиция подсказывает, что
естественная способность различать образы зиждется на умении автоматически разбивать сложные объекты на более простые.
skin: article/incut(default)
data:
{
"_essence": "test",
"id": "3546581",
"incutNum": 1,
"repl": "<1>:{{incut1()}}",
"uid": "_uid_3670185_i_1"
}
В случае относительно простых моделей мы можем сообщить компьютеру заранее, как и на какое число элементов следует разбить объект. Но что делать в ситуации, когда объекты очень сложные (молекула белка), непредсказуемые (незнакомый ландшафт) и тем более когда простые элементы образуют бесконечно разные конфигурации — сами, или если смотреть на них под разными углами, или и то и другое одновременно?
В этом случае требуется найти независимое от нас, универсальное и устойчивое правило, по которому вычислительное устройство без предварительной подсказки будет разбивать сложные объекты на более простые и, высчитывая их соотношение, правильно распознавать какие угодно формы.
Поиск и формулировка такого правила — та самая жар-птица, за которой гоняются теоретики и практики систем распознавания образов.
Прогресс здесь достигнут немалый, но все существующие методы от вышесформулированного правила пока что далеки, так как требуют участия человека, задающего параметры разбиения объекта на тех или иных стадиях распознавания.
skin: article/incut(default)
data:
{
"_essence": "test",
"id": "2759201",
"incutNum": 2,
"repl": "<2>:{{incut2()}}",
"uid": "_uid_3670185_i_2"
}
Итак, как сформулировать универсальный алгоритм, сегментирующий незнакомые сложные объекты по одному и тому же правилу? Группа Рамани предложила искать такое правило не в математических абстракциях, а в
физической реальности, управляемой общими законами. И нашла подходящий вариант в уравнениях теплопроводности, описывающих диффузию тепловой энергии в сплошных средах.
skin: article/incut(default)
data:
{
"_essence": "test",
"id": "3500598",
"incutNum": 3,
"repl": "<3>:{{incut3()}}",
"uid": "_uid_3670185_i_3"
}
Эту карту группа Рамани и предлагает использовать в качестве уникальной «тепловой подписи» объекта.
Зафиксировав градиентную разницу температур между точками, можно перевести тепловую карту в двумерную гистограмму, в которой расстояние между точками будет соответствовать определенному фигурному сегменту. Теперь независимо от того, как расположатся точки фигуры в пространстве, то есть геометрически, градиентные расстояния — рисунок гистограммы — будет одинаковым. Другими словами, как ни крути объект, его «тепловая подпись» останется все время той же.
skin: article/incut(default)
data:
{
"_essence": "test",
"id": "3630341",
"incutNum": 4,
"repl": "<4>:{{incut4()}}",
"uid": "_uid_3670185_i_4"
}
Как бы то ни было, никто не предполагал, что уравнения из области тепловой физики, к которым в разное время приложили руку Франсуа Фурье и Альберт Эйнштейн, получат столь неожиданное применение. Блестящий пример полезной конвергенции наук.