攜程問道,可不可靠?
家人們誰懂啊?小新最近被大模型給雷得外焦裡嫩。
我有個朋友要從蘭州來北京,我說咱去看一下攻略,好多景點要預約。朋友大手一揮說:“沒事兒,我去攜程問”。然後就問出了這麼個結果:
早上去天壇,下午去前門大街,重點來了,傍晚時分去國博。不是,國博下午四點就不讓進了,你讓我傍晚去?這來北京旅遊的第一天就“真刑”啊?
根據攜程問道的思路,頭一天晚上去國博,第二天無縫銜接去看升旗玩故宮,然後再去南鑼鼓巷;第三天再去頤和園和圓明園。
就算是特種兵來了,看見這個旅遊規劃都得搖搖頭,它還說考慮到了便利性,很輕鬆?
但我朋友他不信邪啊,覺得這不是大模型的問題,是他提問的問題,然後就又試驗——去甘肅旅遊5天推薦哪裡?
第二天還算正常在蘭州玩一玩;第二天推薦去塔爾寺與東關清真大寺;不是攜程啊,咱們就是說,這倆地方它在青海啊,它是西寧的啊,你要不要這麼離譜啊。
同樣的問題我在KIMI和通義千問上驗證了一下,推薦的各不相同,但是沒出現把青海景點當甘肅景點的烏龍。
KIMI
通義千問
然後朋友又問攜程問道,最近去甘肅的甘南玩需要穿什麼?推薦甘南的什麼景點?其實是想爲難一下攜程問道,因爲甘南天氣已經很冷了。
結果問道說,甘南的天氣未提供。咋的?直接繞過了,咱就不能買個天氣數據嗎,這不是旅遊必備的嗎,實在不行,咱不用大模型,咱用爬蟲抓都能抓出來天氣數據啊。
同時也看了看KIMI和通義千問的作答,因爲問的問題比較籠統,但是這兩個平臺也都給出了一些方案。
KIMI
通義千問
對了,攜程問道能精確地回答啥問題呢,我試了試它推薦我問的問題:
廣州爲什麼叫羊城?
如何感受新加坡的美食文化?
鳳凰傳奇演唱會必會的大合唱歌曲是啥?
但是這幾個問題,更方便的是去某度或者某書啊。
總結一下,用戶出行都在糾結“去哪玩”“怎麼玩”“怎麼玩更划算”的問題,在旅遊大模型身上,用戶對於攜程問道的期望,是能夠代替甚至超越傳統旅行社的職能,給出一些可用且合理的旅行建議。
但是目前,不論是海外的Expedia、Kayak、Skyscanner、Hopper,還是國內的攜程問道,大家推出的AI工具,都有層出不同的bug。
例如Expedia接入的是ChatGPT模型接口,它就曾對GPT“一本正經的胡說八道”表示無奈。Expedia 這樣說:我們“已經採取措施以限制不準確的結果和不當響應;有時候,其體驗可能與預期存在一定距離。”
特別是到了中文語境中,大家都對旅遊大模型是否能適配“捏把汗”。今年7月初發布國內第一個旅遊大模型時,樑建章曾介紹,“攜程問道”是在通用大模型的基礎上,篩選200億高質量非結構性旅遊數據,結合攜程現有結構性實時數據以及攜程歷史訓練的機器人和搜索算法,進行了自研垂直模型的訓練。
他認爲,相比常見的通用大模型,“攜程問道”的最大優勢是其在旅遊行業的多年經驗。“攜程全球有幾萬名員工分佈在世界各地,他們是旅遊專家,所以攜程能夠比較低成本、高效地去做這部分的工作,把算法、人工跟實時的數據結合起來。”
所以許多用戶把自己的旅遊計劃交給攜程問道安排,是希望可以找到更省心的解決方案,雖然AI助理不可能完全代替消費者的決策,但是起碼也要給出更貼近實際的方案嘛。
現在回頭來看,國內旅遊行業的首個大模型,先得克服在旅途中倒忙啊!