生成式 AI 已經成為我們生活中的幫手之一,只要有問題,打開跟 AI 的對話框直接問它,比起我們自己慢慢搜尋來的更快,現在有這麼多的免費 AI 可以用,哪個生成式 AI 比較好用?該怎麼向 AI 提問才能得到我想要的回覆?本篇塔塔就要來幫大家測試 ChatGPT、Gemini、Claude 以及 Perplexity 四款可以免費使用的 生成式AI!
4 款生成式 AI 簡介
▉ ChatGPT
ChatGPT 是由 OpenAI 所開發的人工智慧聊天機器人,採用大型語言模型(Large Language Model,LLM),最新模型版本來到 GPT- 4o、GPT-4o mini,使用者可以透過打字的方式與 ChatGPT 進行互動,像是人與人之間自然的對話方式,ChatGPT 能夠幫使用者自動生成文字、郵件內容、摘要等文字任務。
目前最新版本 GPT-4o 對所有用戶開放,免費用戶每日有 3 次的使用限制。
圖片來源:OpenAI
▉ Gemini
Gemini 是 Google DeepMind 團隊所開發的生成式 AI,前身為 Bard,經過多次更改 Gemini 採用的模型後,最終定案為 Gemini Pro 大型語言模型,並將 Bard 改名為 Gemini,目前免費版本最新模型為 Gemini 1.5 Flash,向所有用戶開放免費使用,同樣可藉由文字與 Gemini 進行自然對話,並結合 Google 自家的各項服務,打造完整 Google 生態系。
圖片來源:Google
▉ Claude
Claude 是由 Anthropic 所開發的人工智慧模型,Claude 遵循合憲人工智慧, 也就是在 AI 訓練過程中,僅提供 AI 原則性指導,並讓 AI 自行判斷輸出的內容是否恰當,以自我改進的方式,來訓練出相對無害的模型,目前 Claude 最新模型版本為 3.5 Sonnet。
圖片來源:Anthropic
▉ Perplexity
Perplexi 由同名新創公司所開發的,是一款結合了聊天機器人以及搜尋引擎的 AI 平台,使用者可以在上面搜尋到網路上的最新資訊,並附上資料來源佐證,方便使用者進行查證,目前 Perplexity 分為免費版以及付費版兩種服務,免費版本使用的是該公司獨立的大型語言模型,付費版本則是可以訪問 GPT-4、Claude 3.5 等其他模型。
圖片來源:Perplexity
該怎麼向 AI 提問?
大家在用 AI 的時候有沒有遇過一個問題:怎麼問出來的答案跟我要的不一樣?其實就跟我們跟一般人溝通是一樣的,如果說的資訊過於片段或是零碎的話,AI 目前還無法像我們人類一樣分辨出我們要講的內容,所以就會出現雞同鴨講的狀況。
塔塔建議大家在詢問之前,可以先將設想自己想要什麼樣的回答,並列出各項條件,在向 AI 下指令的時候將這些條件都包含進去,若 AI 產出的答案還是有些許偏差的話,也可以再將剛剛的指令、描述重新檢視一遍,並將可能對 AI 來說較不清楚的地方重新詳細的描述一次,這樣大機率可以得到理想中的回答喔!
實際測試 4 款 AI
接下來塔塔會實際詢問 3 種類型的問題,分別是生活類、時事類以及科技類,初始詢問的問題皆是相同的,後續追問依照 AI 給出的回應進行調整,究竟這 4 款 AI 會給出什麼樣的回答呢?快跟著塔塔一起來看吧!
▉ ChatGPT
- 生活類問題(食譜)
首先向 ChatGPT 詢問「如果我想要煮一道簡單又快速的家常料理,可以推薦我有什麼菜嗎?」,它提供給了我三道家常菜,並且附上簡略的步驟,料理步驟以及需要準備的材料也沒有出現奇怪的問題,符合正常邏輯。
▼ ChatGPT 提供的料理與步驟
- 生活類型問題(旅遊規劃)
接下來請 ChatGPT 安排台中四日遊的行程,提示詞為「請幫我規畫台中四日遊行程,行程需要包括自然風景景 點、人文景點以及用餐地點,並且交通便利,有住宿地點與資料」,即便沒有特別要求 ChatGPT 要將車程時間與交通方式列出來,ChatGPT 也會自動將這些內容提供給使用者。
▼ ChatGPT 會將車程時間與交通方式列出
將 ChatGPT 所提供的交通方式與時間透過 Google 地圖進行查證,經過查證後,發現第一天晚上的行程,以步行方式從「宮原眼科」到「草悟道」ChatGPT 標示時間需 5-10 分鐘,在 Google 地圖上顯示步行時間需要 37 分鐘,開車或是騎車才有可能 10 分鐘左右抵達,這代表 ChatGPT 的資料可能出現了謬誤。
▼ 實際上由「宮原眼科」到「草悟道」步行時間需要接近 40 分鐘
- 時事類問題
向 ChatGPT 詢問「最近台灣有什麼時事」,ChatGPT 搜尋的 5 個新聞資料來源分別來自 3 家不同的新聞媒體,在資料來源的多元性與更新度上,稍嫌不足,它提到 10 月份侵襲台灣的颱風康芮,卻沒提到時間上最接近的颱風天兔。
▼ 在氣候事件的部分提供了稍舊的資訊
- 科技類問題
向 ChnatGPT 詢問 NVIDIA 最新開發的人工智慧系統 Eureka ,指令為「請詳細說明 NVIDIA Eureka 系統是什麼,以及它會被應用在哪個領域或產業中」,ChatGPT 回答的層級分成兩層,簡潔有力,除了回答到問題外,也提供了未來會應用到的領域。
雖然 ChatGPT 在旅遊規畫中出現了謬誤,整體來說使用體驗還是不錯的,因為 ChatGPT 可以較簡單、自然的方式問答,不用修改太多指令就能得到資訊,回覆內容雖然不多,但都有回答到問題點上,並沒有出現指令判斷錯誤或是漏判的問題,在使用過程中就不會一直懷疑自己的指令下錯或是漏下了。
▉ Gemini
- 生活類問題(食譜)
詢問同樣的問題「如果我想要煮一道簡單又快速的家常料理,可以推薦我有什麼菜嗎?」,Geimin 提供許多適合新手的料理,從主食到配菜再到湯品,還提供料理小撇步,料理多樣,將餐桌上常出現的類型都提供出來,料理小白也能煮出三菜一湯。
- 生活類型問題(旅遊規劃)
給 Gemini 同樣的提示詞「請幫我規畫台中四日遊行程,行程需要包括自然風景景點、人文景點以及用餐地點,並且交通便利,有住宿地點與資料」,Gemini 給出了每個景點的照片供使用者參考,照片的來源有些來自官方或是部落客的分享,可以直覺地的判斷喜不喜歡這個景點,但很可惜它並沒有正確判斷指令,少給了住宿地點。
▼ Gemini 會提供使用者景點照片
Gemini 與 Google 生態系做結合,所以當使用者向 Gemini 詢問地圖或是車程時間、路線等問題時,Gemini 會自動連接至 Google 地圖,並且顯示在對話框當中,但在計算車程時間的時候,跨天的車程時間計算,Gemini 會出現起點錯誤問題。
▼ 使用者能透過 Gemini 快速連結至 Google 地圖內查看交通路線
- 時事類問題
同樣提出「最近台灣有什麼時事」來詢問 Gemini,它所提供的資料時間範圍從 2024 年初到 11 月中下旬都有,時間線拉的非常的長,雖然提供的內容多,但是實際上卻沒有太多新事件的報導,在氣候的部分,提供的是長期的氣候問題而不是短期氣象資訊。
▼ Gemini 所提供的時事資訊
- 科技類問題
向 Gemini 詢問 NVIDIA 最新開發的人工智慧系統 Eureka ,指令為「請詳細說明 NVIDIA Eureka 系統是什麼,以及它會被應用在哪個領域或產業中」,Gemini 給出的回覆長度較長,在講解 Eureka 系統時,用較清晰的列點式讓一般人可以快速理解該系統的工作原理。
▼ Gemini 對 Eureka 系統的說明
Gemini 給出的回覆相對長一點,內容雖然沒有很精細,但是得益於它結合了 Google 其它的服務內容,在進行行程安排或是時事查詢的時候給出的資訊相對完整且多元,不過在判斷指令的時候,Gemini 並沒有很精準,需要多次調整指令才能讓 Gemini 回覆出理想的內容。
▉ Claude
- 生活類問題(食譜)
塔塔同樣向 Claude 詢問「如果我想要煮一道簡單又快速的家常料理,可以推薦我有什麼菜嗎?」,Claude 給出的回覆相對簡單,它將料理步驟用幾句話快速帶出,非常簡潔有力,雖然沒有特別提到材料內容,但依照它給出的菜色來看,即使不特地寫出來也能夠知道要準備些什麼。
▼ Claude 提供的料理資訊
- 生活類問題(旅遊規劃)
將提示詞「請幫我規畫台中四日遊行程,行程需要包括自然風景景點、人文景點以及用餐地點,並且交通便利,有住宿地點與資料」輸入 Claude 提問後,Claude 對每個景點都列出了 2 點或以上的重點,例如門票價格、必吃美食、景點特色等。
▼ Claude 提供的旅遊規劃
在回覆的最後,Claude 提供每個類別的預算以及這個行程中每位人員的總預算是多少,這個部分塔塔個人非常喜歡,在規劃行程的時候,預算的問題是最麻煩的,要到處找最新價格資訊,現在 Claude 直接幫我們算好了,省了不少搜尋資料的時間。
▼ Claude 會為使用者統計行程所需預算
- 時事類問題
接下也同樣向 Claude 詢問「最近台灣有什麼時事」,Claude 回覆的時間線拉得很長,從 2024 年年初台灣總統大選開始,但在立法院正副院長的地方出現明顯錯誤,進一步詢問時同樣給出不正確答案,甚至出現非台灣人士,且未包含最近的時事,僅出現台灣上半年的時事。
▼ Claude 提供的時事資訊時間較舊
- 科技類問題
同樣向 Claude 詢問 NVIDIA 最新開發的人工智慧系統 Eureka ,指令為「請詳細說明 NVIDIA Eureka 系統是什麼,以及它會被應用在哪個領域或產業中」,Claude 給出的回覆相當的長,除了給出 Eureka 系統的的特色設計以外,還給出了目前已展示的成功案例、潛在影響的產業和未來發展趨勢。
▼ Claude 針對 Eureka 系統提供的資訊
Claude 給出的回覆很長,內容也相對詳細,但在時事類型的問題上,出現了很明顯的錯誤,且更進一步詢問的時候仍然出現了錯誤,可能跟 Claude 的知識庫更新時間有關係,目前 Claude 的知識庫是截至 2024 年 7 月的資訊,且 Claude 尚不支援檢索網路上即時資訊的功能,僅能使用知識庫內的資料進行回答。
▉ Perplexity
- 生活類問題(食譜)
向 Perplexity 詢問同樣的問題,Perplexity 除了提供菜色推薦外,也將搜尋到的料理做法統一找李再上方的來源當中,方便使用者查證或是更進一步進行查詢,並且在每個回覆的最後給出來源編號,使用者同樣可以透過這個編號快速進到來源中,若有影片的話也會顯示在對話框右側。
▼ Perplexity 所提供的料理與做法
- 生活類問題(旅遊規劃)
向 Perplexity 輸入提示詞「請幫我規畫台中四日遊行程,行程需要包括自然風景景點、人文景點以及用餐地點,並且交通便利,有住宿地點與資料」,Perplexity 給出的行程安排與其它的模型不同,不全是知名景點,較有新意,且安排了很多運動類型的行程,像是爬山、騎自行車等。
▼ Perplexity 設計的行程較少知名景點
- 時事類問題
接下來也向 Perplexity 詢問「最近台灣有什麼時事」,Perplexity 提供的時事資料時間大多是一周內所發生的事件,可惜的是部分資料並不是最新的資料,內容描述也較少,同樣也有附上資料來源,不過並沒有給出確切的文章出處,只有引導至新聞媒體的首頁,在使用者驗證上不太方便。
▼ Perplexity 提供的時事資訊
- 科技類問題
最後向 Perplexity 詢問 NVIDIA 最新開發的人工智慧系統 Eureka ,指令同樣為「請詳細說明 NVIDIA Eureka 系統是什麼,以及它會被應用在哪個領域或產業中」,Perplexity 給出的回覆長度中等,內容相對精煉,也都有將 Eureka 系統的特點以及會應用在哪個領域中清楚列出來。
▼ Perplexity 對 Eureka系統的說明
Perplexity 附上的資料來源多樣,且能夠提供較新的資料,雖然有時候會出現不是最新資訊的問題,進一步詢問的時候給出的是正確內容,Perplexity 在搜尋、整理的過程中,可能爬梳到的資料是舊資料,而不是最新的資料,使用者在使用這些資訊的時候,必須要小心驗證。
總結、比較
看完 ChatGPT、Gemini、Claude 以及 Perplexity 的實測後,塔塔製作了這四種模型的評分表格給大家參考:
ChatGPT | Gemini | Claude | Perplexity | |
回覆長度 (滿分 5 分) | 4 | 4.5 | 4.5 | 4 |
指令判斷正確度 (滿分 5 分) | 4.5 | 3.5 | 4.5 | 4.5 |
內容正確度 (滿分 5 分) | 4 | 4 | 3.5 | 4 |
資料新舊程度 (越新分數越高,滿分 5 分) | 4.5 | 4 | 3 | 4.5 |
資料來源多樣性 (滿分 5 分) | 4 | 4 | 3 | 4.5 |
編輯推薦指數 (滿分 5 分) | 4.5 | 4 | 3.5 | 4.5 |
(備註:此表格為編輯個人使用經驗,最終使用感受依個人使用為準)
如果是想要找即時性資料的使用者,塔塔會推薦使用「Perplexity」,它能夠從網路上檢索到即時性的新聞或資訊,不用擔心會出現半年以前的資訊;如果是想要找一個能夠以自然方式對話而不用一直改指令的 AI,塔塔會推薦使用「ChatGPT」,它最大的特色就是可以讓使用者以最自然的方式與 AI 對話,在使用上也確實非常流暢。
而今天如果你想要找一款重點式說明的 AI,那麼「Claude」非常適合,它會將回覆內容條列式呈現,能夠一眼就知道重點;如果是會常用到 Google 各項服務的使用者,那麼「Gemini」絕對是第一選擇,它能夠讓你在使用 Google 生態系服務時更加方便,並且可以透過 Google 搜尋直接叫出 Gemini,操作上很便利。
首圖來源:Unsplash