Сравнение двух списков (поиск полных соответствий)

При организации перевода необходимость в сравнении двух списков возникает тогда, когда надо, например, сопоставить два глоссария.

В филологических изысканиях иногда требуется проверить извлеченные из анализируемого текста единицы на их наличие в какой-нибудь сторонней базе данных.

Описание задачи

Предположим, у нас есть список цветообозначений (взят отсюда) и список извлеченных (программой mystem) из текста песни Виктора Цоя «Звезда по имени солнце» лексем.
Список цветообозначений
абрикосовый
аквамариновый
алый
амарантовый
аметистовый
антрацитовый
арлекин
баклажановый
бананомания
бежевый
белоснежный
белый
бирюзовый
бисквитный
бистр
бобровый
болотный
бордовый
бронзовый
бургундский
бурый
ванильный
васильковый
вердепешевый
вердепомовый
византийский
византия
гейнсборо
голубой
горчичный
гранатовый
гридеперлевый
грушевый
гуммигут
гусеница
желтый
жимолость
зеленый
изумруд
изумрудный
индиго
камелопардовый
кардинал
кармин
кварцевый
киноварь
кирпичный
коралловый
кордованский
коричневый
коричный
космос
кофейный
красный
кремовый
кукурузный
лайм
ламантин
латунный
ливерный
лиловый
лимонный
лососевый
льняной
магнолия
маисовый
малахитовый
малиновый
мандариновый
маренго
марсала
медный
медовый
миртовый
мокасиновый
морковный
мурена
мятный
небесный
нефритовый
ниагара
одуванчиковый
оливковый
оранжевый
орхидея
охра
панг
персиковый
перу
песочный
пурпурный
пшеничный
пюсовый
розовый
румянец
рыжий
салатовый
сангина
сапфировый
селадон
серебряный
серобуромалиновый
серый
сиена
сизый
синий
сиреневый
скарлет
сливовый
сливочный
сомон
спаржа
телегрей
телемагента
терракота
терракотовый
тиффани
тициановый
томатный
травяной
ультрамариновый
фанданго
фельдграу
фиалковый
фиолетовый
фисташковый
хаки
циннвальдит
черный
чертополох
шамуа
шафрановый
шоколадный
экрю
электрик
янтарный

Слова (в начальной форме), извлеченные из текста
а
без
белый
быть
война
всегда
в
год
город
да
два
дело
дорожный
дотягиваться
до
другой
дым
желтый
живой
жить
закон
закрывать
звезда
земля
знать
имя
и
красный
кровь
кто
лед
лекарство
лоскутный
луч
любить
много
молодой
молодые
морщина
мы
над
на
небесный
нет
не
ни
облако
одеяло
она
он
опалять
особый
петля
плыть
под
помнить
по
причина
проживать
просто
против
растрескиваться
свет
серый
слово
снег
снова
согревать
солнце
сон
способный
судьба
считать
так
трава
три
тысяча
уже
умирать
упасть
цветок
час
через
чин
что
это

Нам необходимо автоматически определить, какие лексемы в тексте песни можно отнести к цветообозначениям на основании сравнения двух списков. Подобная задача решается просто при умении создавать реляционные базы данных (например, в MS Access) и обращаться к ним, но ее можно решить и в MS Excel с помощью функции ВПР.

Важно помнить, что корректное использование этого метода возможно, только если каждый элемент встречается только один раз в пределах одного списка.

В примере на видео (при просмотре лучше включить субтитры) столбцам присвоены заголовки, однако наличие заголовков не принципиально – они приведены для пояснения. В поле «Результат» будем записывать формулу

Решение

Скопируем оба списка в MS Excel так, как это показано на видео ниже. Чтобы продемонстрировать еще одну возможность описываемой функции MS Excel, я аннотировал цветообозначения – добавил указание на то, является ли цвет основным или дополнительным.

Можно сравнивать и не аннотированные списки, то есть списки, которым в соседнем столбце не сопоставлены никакие значения. Для этого в поле Номер_столбца введем «1». В этом случае в поле «Результат» будет вставлена совпадающая единица из первого списка.