За даними торішнього дослідження comScore, планування поїздки і купівля квитків через інтернет стала невимовним кошмаром для тих, хто готується відпочивати. І причина не в тому, що важко проводити операції з якимись сервісами з продажу квитків, а у величезній кількості непотрібної інформації, з якою доводиться стикатися при плануванні подорожі. За даними дослідження comScore, в середньому для того, щоб скласти план поїздки потрібно скористатися 12-ма пошуковими системами, орієнтованими на подорож, відвідати 22 веб-сайти: на це йде зазвичай близько 29 днів. Семантичний пошуковий проект UpTake (у минулому Kango) покликаний полегшити завдання користувачам.
UpTake являє собою пошуковий движок з вертикальною системою пошуку, яка володіє найбільшою базою даних, що складається з більш ніж 400,000 готелів і розважальних установ Америки, згадуваних більш ніж на 1,000 сайтах. Використовуючи такий вертикальний підхід зверху-вниз, UpTake вдалося зібрати понад 20 мільйонів відгуків, думок і описів готелів і розважальних закладів США і надавати цю інформацію за смисловим запитом. Це щось на зразок Metacritic тільки для мандрівників. Основним критерієм пошуку є не тільки рейтинг популярності, UpTake так само намагається охарактеризувати готель або розважальний заклад на основі інформації, яку пошукова система черпає з бази даних. Наприклад, чи підходить готель для сімейного відпочинку, чи годиться місце, інформацію про яке ви запитуєте, для романтичної подорожі, чи прийнятна вартість відпочинку, тощо.
"UpTake так само надає користувачеві найбільш корисні описи, фото, і т. д. для найбільш відповідних готелів і розважальних закладів, вибір яких заснований на атрибутивному і відносному аналізі оглядів та інших текстових даних. Аналіз покликаний на основі нашої онтології подорожі вибрати найбільш значущі мета-теги ", - говорить президент компанії Ен Лі (Yen Lee), один із засновників офісу CitySearch в Сан-Франциско і колишній Генеральний менеджер Yahoo! в області подорожей.
З чим не можна порівняти UpTake, так це з сервісами з продажу квитків, такими як Expedia, з пошуковими сервісами, чий пошук заснований на вартості відпочинку (Kayak) або спільнотою мандрівників. UpTake займається лише сортуванням описів і семантичним аналізом; за допомогою цього сервісу неможливо замовити квитки. За даними компанії тільки 14% користувачів формують запит про замовлення квитків, що символізує наступне: користувачі більше зацікавлені у вивченні місць відпочинку, вартість відпочинку для них вторинна. У багатьох списках на сайті є можливість перевірити рейтинг готелю, дані беруться з сайтів третіх осіб. Так в UpTake планують заробляти.
UpTake працює за допомогою спеціально створеної онтології подорожей, яка складається з об'єктів, зв'язків між цими об'єктами і правил, за якими генерується результат, адже в базі даних 20,000 відгуків і описів. Ця онтологія дозволяє UpTake отримувати сенс зі структурованої або частково структурованої інформації виду «басейн рівень комфортабельності готелю і діти люблять басейни». Таким чином, готель отримає додаткові бали, якщо в його описі зустрінеться фраза «підходить для відпочинку з дітьми». У дану онтологію так само закладено, що басейн, в якому плавають оголеними, для дітей неприйнятний.
Спрощена модель онтології представлена нижче.
У добавок до всього система враховує так само і яким ви плануєте відпочинок - романтичну подорож, сімейний відпочинок або відпочинок на відкритому повітрі - сайт враховує і душевний стан для того, щоб визначити, чи сподобається користувачеві щось із того, що буде представлено в результатах пошуку. Пошуковий рушій шукає слова з емоційним забарвленням, такі як «подобатися», «любити», «ненавидіти», «забитий» або «з хорошим виглядом», і на основі цих слів робить висновок про те, подобається готель людям чи ні, і що вони про цей заклад думають. Всі ці зібрані дані відображаються в рейтингу, який існує для кожного місця відпочинку.
Висновок.
Вчора ми нашвидкуруч протестували пошуковий движок Powerset, заснований на звичайному мовному пошуку, і виявили, що результати практично не відрізняються від тих, що представляє Google. Ми писали про те, що «Google не здає своїх позицій і залишається» досить хорошим «рішенням, у Powerset піде багато часу на те, щоб переманити користувачів до себе». Але, не дивлячись на те, що семантичний пошук може здатися поки незграбним і громіздким для сучасної глобальної мережі, все одно здатний внести великий смисловий внесок у різного роду тематичні вертикалі. Онтологія більш обмежена, і такий сайт не намагається відповідати на специфічні питання, але він володіє можливістю семантичного визначення концепту, такого як романтичність або, що більш важливо, визначенням якості.
Я запитав Ена Лі, що в UpTake думають про вертикальний підхід зверху-вниз в порівнянні з традиційним підходом знизу-вгору. Лі відповів, що підхід зверху-вниз має всі шанси для того, щоб витіснити підхід знизу-вгору з Semantic Web. Лі вважає, що спроби підходу зверху-вниз винести сенс з неструктурованої або частково структурованої інформації, поряд зі спробами Yahoo! вбудувати в індекс семантичну надбудову, спонукають публікаторів контенту почати використовувати семантичні модулі в інформації. Лі так само зазначив, що багато партнерів вже звернулися в UpTake з питанням про те, як організувати інформацію таким чином, щоб сервісу було легше її аналізувати.
Передбачається, що пошукові сервіси з вертикальною системою, такі як UpTake, допоможуть більш повно представити потребу користувачів і таким чином в семантичному Web буде легше продавати послугу кінцевому споживачеві. Можливість шукати серед мільйонів описів і відгуків і змусити, комп'ютер показати саме те, що вам потрібно - ось, у чому головна комерційна цінність ідеї сенсового Web. Коли подібні технології стануть досконалішими, можливо з'являться движки, основою яких стане нейролінгвістичне програмування, можливо Powerset почне показувати результати набагато краще, ніж Google (але не варто забувати ні на хвилину про те, що і в Google не будуть сидіти склавши руки і чекати біля моря погоди...)