[AI談]各大平台的AI發展情況,學習紀錄使用

現在各平台的AI發展迅速,這是我的筆記內容,會持續更新,持續更新才能在時代中搶得先機。

估計是想要搶在政府控管之前先自行規範一個範圍,注意此為安全協議不是發展協議!


微軟

Copilot|參考文章

Copilot AI是一個由GitHub和OpenAI合作開發的AI輔助編程工具,它可以根據你的代碼和註釋來自動完成代碼或建議代碼片段。Copilot AI利用了OpenAI的GPT-4模型,這是一個強大的自然語言生成模型,可以理解各種編程語言和框架,並且學習了數以億計的公開代碼庫。Copilot AI有什麼特點呢?以下是一些重點:

  • 你快速寫出新功能或修復錯誤,無需花時間搜索文檔或示例代碼。
  • 寫出更高質量和更安全的代碼,它會考慮邊界情況、錯誤處理、測試等方面。
  • 學習新的技術或框架,它會根據你的需求和偏好來提供最佳實踐和建議。
  • 創造更有趣和更有創意的代碼,它會嘗試生成不同的解決方案或變化,讓你選擇最適合的。

如果你想了解更多關於Copilot AI的信息,請訪問https://github.com/github/copilot 或 https://copilot.github.com/ 。如果你想嘗試使用Copilot AI,在GitHub上申請預覽版即可。

Image Creator 影像建立者|參考文章

  • 一個可以根據使用者的文字描述,產生出相對應的影像的線上工具 。
  • 是基於 OpenAI 的 DALL-E AI 影像生成技術,利用 120 億參數版本的 GPT-3 Transformer 模型來理解自然語言輸入並生成影像。
  • 可以處理各種複雜、抽象或創意的文字描述,例如「五邊形形狀的綠色皮革錢包」或「一隻悲傷水豚的等距視圖」。
  • 可以生成單一影像,還可以生成多個不同風格或角度的影像,讓使用者有更多選擇 。
  • 目前僅支援英文,但微軟表示正在開發其他語言當中。Image Creator 也會在影像上加上浮水印等方式,指出影像為 AI 的創作。
  • 免費且無需排隊使用的,只要進入 Bing 或 Edge 的 AI 聊天機器人介面,切換到「更多富有創意」模式,就可以體驗這項功能 。微軟也提供了一個 專門的影像創作器 網站可以試玩。

Bing AI

Bing AI 是微軟在新版 Bing 搜尋引擎和 Edge 瀏覽器中整合的一套人工智慧技術,它可以讓你以全新的方式使用網路。Bing AI 不只是一個搜尋引擎,它也是一個聊天機器人和一個創作工具。以下是 Bing AI 的幾個特點:

  • 優化搜尋體驗:根據你的關鍵字或語音輸入,提供更精準、更相關、更即時的搜尋結果。它也可以動態產生知識卡片和故事,讓你快速獲得重點和背景資訊 。
  • 提供完整的答案:理解你的自然語言問句,並透過多個來源和角度,給你最完整的答案。它也可以摘要、比較、分析和視覺化資料,讓你更容易理解和利用資訊 。
  • 全新的聊天體驗:和你進行高度互動的聊天,幫助你完成更複雜的問題或任務。它也可以根據你的喜好和需求,提供個性化的建議和連結,讓你可以立即採取行動 。
  • 激發創意的火花:根據你提供的提示或描述,產生各種內容,如影像、文章、歌詞、笑話等。它也可以調整內容的語調、格式和長度,讓你可以創作出符合目的和風格的作品 。

Bing AI 的核心技術是基於 OpenAI 的 DALL-E 模型的先進版本,它是一個大型人工智慧語言模型,可以從文字生成影像 。微軟也開發了一套專門使用 OpenAI 模型的方法,稱為 Prometheus 模型。Prometheus 模型讓微軟能夠最好地運用 OpenAI。

4/9號更新:Bing AI 被融入微軟 SwiftKey 鍵盤輸入法


Adobe

Firefly|參考影片

Firefly 是 Adobe 推出的一款基於人工智慧的視覺設計工具,可以幫助設計師快速創建和修改圖形、動畫和視頻。Firefly 的 AI 有以下幾個重點特色:

  • 自動生成風格:根據設計師的喜好和目標,自動生成適合的風格,如簡約、復古、抽象等,並提供多種選項供設計師選擇和調整。
  • 智能優化:根據不同的平台和場景,智能優化圖形、動畫和視頻的尺寸、比例、格式和品質,以達到最佳的效果和性能。
  • 智慧配色:根據圖形、動畫和視頻的內容和主題,智慧配色,提供協調和醒目的色彩方案,並支持自定義和收藏。
  • 智能裁剪:根據圖形、動畫和視頻的重點部分,智能裁剪,保留最精彩的內容,並避免不必要的空白或干擾。
  • 智能轉換:可以將圖形、動畫和視頻轉換為不同的類型或格式,如將靜態圖片轉換為動畫或視頻,或將視頻轉換為 GIF 或 PNG 等。

Sensei AI|參考文章

Sensei AI是Adobe公司開發的人工智能和機器學習平台,它可以幫助用戶創造和優化不同類型的數字體驗。Sensei AI的特點有以下幾個:

  • 深入分析數據,提供有價值的洞察和預測,幫助用戶做出更好的決策。
  • 增強用戶的創意表達,提供快速而準確的編輯工具,讓用戶輕鬆找到和使用合適的內容。
  • 加速用戶的工作流程,自動化一些繁瑣而重複的任務,讓用戶節省時間和精力。
  • 驅動用戶的實時決策,根據不同的場景和目標,調整和優化廣告投放和個性化推薦。

Sensei AI涵蓋了多個領域和產品,例如分析、行銷、創意、廣告和文件等。Sensei AI不斷地學習和進化,以適應不斷變化的市場需求和用戶期望。Sensei AI是Adobe公司致力於創新和領導數字體驗產業的重要證明。

我本身很關注Adobe這套顛覆設計領域的AI推出,想必推出後會讓創造更多的可能性出現!


Open AI

ChatGPT-4

  • GPT-4 的四大特色是:擁有更高智慧與精準度、支援視覺輸入、具備圖像辨識能力、降低胡言亂語的可能性、在敏感問題上提供更佳回應方式。
  • GPT-4 的免費使用方法有:使用最新版的 Bing 聊天功能 ,或者每四小時向 Poe App 提問一次。
  • GPT-4 的付費使用方法有:訂閱 ChatGPT Plus ,或者加入 OpenAI 的候選名單。

Open AI AKA時代先驅者 AKA無意間的降維打擊Google最大收入的廣告屠殺者


Google 

Bard|參考文章

它是由一個大型語言模型(LLM)驅動的,這種技術也被其他聊天機器人如OpenAI的ChatGPT和微軟的Bing使用,它們都是通過大量的網路文本和資訊來訓練的。Bard AI有什麼特點呢?以下是幾個重點:

  • 根據你給它的提示,生成一個或多個回應,每次選擇最可能出現在下一個位置的單詞。它不僅考慮到最有可能性,還考慮到一些靈活性,讓回應更有創意。
  • 讓你選擇最適合你的回應作為對話的起點,然後你可以繼續和它合作,提出跟進問題。如果你想看到另外一種回答,你也可以讓它再試一次。
  • 基於Google對優質資訊的理解而建立的。它會盡量提供正確、有用和友善的回答,但也會承認自己不完美。如果它發現自己提供了錯誤、誤導或虛假資訊,或者反映了現實世界中存在的偏見和刻板印象,它會警告用戶並道歉。
    – Bard AI目前只在美國和英國開放測試使用,未來會拓展到更多國家和語言。Google希望通過收集更多用戶反饋來改進Bard AI。

老實說我對於Google的Bard沒社麼特別期待,因為他們現在兩頭燒,要設法更改搜尋方式能夠賺取廣告收益又要研發AI


阿里巴巴

通義千問

阿里巴巴最近推出了他們的大模型「通義千問」,主打中文寫詩、甚至寫情書的文本生成,這是繼百度的「文心一言」之後,中國網企接連推出自家版本類 ChatGPT 服務。通義千問由阿里達摩院開發,是一個專門回應人類指令的大模型,是效率助手,也是點子生成機。此外,阿里達摩院還在研發類 ChatGPT 的對話機器人,目前已開放給公司內員工測試。

阿里巴巴即將於4月11日在北京召開阿里雲峰會,屆時將正式推出阿里大模型,並將於18日推出行業應用類模型。據稱,阿里巴巴的大模型水準將相當於 ChatGPT 2.5 的版本。

這個消息對於自然語言處理領域的研究者和開發者來說是一個令人振奮的消息,因為這意味著越來越多的企業和機構開始認識到自然語言處理的重要性,並開始加大投入研究和開發。這也將促進自然語言處理技術的進步和發展,為我們提供更好的自然語言處理服務和應用。


Meta AI

LLaMA

Facebook 的LLaMA 是一種基於機器學習的語言模型,可以用來分析和理解大量的自然語言數據。LLaMA 的全稱是Language Model with Adaptive Memory Access,意思是這個模型可以根據不同的任務和上下文,動態地存取和更新自己的記憶。LLaMA 的主要特點有:

  • 可以處理多種語言,包括英語、中文、西班牙語等。
  • 處理多種任務,包括文本分類、情感分析、問答系統等。
  • 利用外部知識庫,例如維基百科,來增強自己的記憶和推理能力。
  • 根據數據的變化,自動調整自己的記憶結構和參數,以適應新的情況。

LLaMA 是一個先進而靈活的語言模型,可以幫助Facebook 更好地理解和服務它的用戶和合作夥伴。

Make-A-Video

一個可以從文字生成影片的 AI 系統,特點如下:

  • 建立在 Facebook AI 在生成技術研究上的近期進展之上,為創作者和藝術家開啟了新的機會。
  • 從配對的文字圖像數據中學習世界的外觀,並從沒有相關文字的視頻素材中學習世界的運動。
  • 可以根據幾個單詞或幾行文字,創造出充滿鮮豔色彩、角色和風景的獨一無二的視頻片段。
  • 也可以從圖像生成視頻,或者從現有的視頻創造出類似的新視頻。
  • 遵循 Facebook AI 今年早些時候宣布的 Make-A-Scene 的模式,一種多模態生成 AI 方法,讓人們對他們創造的 AI 生成內容有更多控制權。

4/6 Meta近日更新他們的AI會讓廣告投遞方面更加的方便,簡單點就是能夠創造文案及影片讓廣告主更快速地去設計及投遞,並且也能智能演算出最精準的投遞方式。

其他AI工具

Stable diffusion web ai|參考影片

是一種能夠根據任何文字輸入產生高品質圖像的潛在文本到圖像擴散模型,它利用了數位科技、基因檢測與定序技術等先進的精準醫療領域,為使用者提供創意無限的視覺藝術。到目前為止,它的最新發展是:

  • 推出了 Stable Diffusion Reimagine,一種基於圖像到圖像生成的新算法,能夠自動生成與原始圖像相似風格的變體。
  • 透過收購 AI 圖像處理網站 Clipdrop,將 Stable Diffusion Reimagine 納入其線上應用程式,並計畫將其原始碼開源。
  • 建立了 Prompt Database 功能,讓使用者可以搜索超過 900 萬個來自全球的 Stable Diffusion 提示。
  • 加強了資安防護技術,以保障使用者的隱私權和智慧財產權。

目前已解決Openpose手部問題,以及已推出3D Openpose,目前正在強化mov2mov。

Multidiffusion 參考文章

近期人工智能技術有一項升級,稱為MultiDiffusion模型框架,可以讓使用者控制圖像的生成位置。這個模型可以在預先訓練好的擴散模型上定義一個全新的生成過程,讓使用者能夠掌握更多的控制權。這個模型的主要應用包括文字到高解析度全景生成、精確區域生成、任意長寬比粗略區域生成等。使用者可以只需給出一個提示,例如指定特定的區域位置,就可以生成符合要求的圖像。然而,這個模型仍然存在一些 bug,例如生成一些超現實的圖像。

有點類似你畫一個圓型,你標記這是牛,他就會產出一支圓型的牛給你。

Midjourney

Midjourney 的使用方法很簡單,請參考這篇

Midjourney AI是一款搭在Discord上的AI繪畫聊天機器人,它可以根據你輸入的文字或圖片提示,生成各種風格和主題的圖像。它是由一個獨立的研究實驗室Midjourney開發的,該實驗室專注於設計、人類基礎設施和AI領域。

最近,Midjourney AI發布了最新的V5版本,這是一個經過五個月在Google Cloud的超級叢集上訓練的全新模型,也使用了不同的神經網路架構和美學技術 。V5版本有以下幾個主要的特點:

  • 畫質提高兩倍,達到1024 × 1024(原先V4的畫質是512 × 512)。
  • 提示詞更靈活,可以使用自然語言或逗號分隔的關鍵詞。
  • 新增了一些參數,可以調整圖片提示和文字提示的比重(–iw),生成拼磚花紋(–tile),以及自定義寬高比(–ar) 。

V5版本生成的圖像更接近真實世界的照片,風格更精緻,也解決了以往手指數量和形狀不正確的問題。不過,有些人也認為V5版本生成的圖像仍然處於恐怖谷,有些特徵讓人感到不安。目前,只有付費用戶可以試用V5版本,而且新版本仍然在不斷更新中,官方表示希望接下來能提供更親民和更真實的視覺風格。

Midjourney跟Stablediffusion都是比較著名的AI繪圖系統,而Midjourney操作方面比較簡單易於使用!

Line Moonshot | 參考文章

加入好友就能生出圖片,但圖片畫素低

(簡單說這是入門版AI繪圖)

Mokker | 參考文章

主要是用來更換商品背景的AI,簡單的操作流程,導入已去背的素材後,就能快速地更換背景。

缺點很明顯,雖然標榜能輸出2048×2048,但實際放大明顯模糊,只能用於小圖使用。

(簡單說這網站能讓你的產品快速更換各式各樣背景)

Runway gen2 | 官方網站

runaway reserch AI gen-2 是一種多模態的 AI 系統,可以根據文字、圖片或影片片段生成新的影片。它是 runaway reserch AI gen-1 的改進版本,具有以下特點:

  • 純文字提示合成任何風格的影片,只要能用語言描述,就能視覺化。
  • 圖片和文字提示生成影片,將圖片的構圖和風格應用到文字描述的場景中。
  • 單一圖片生成影片,根據圖片的內容和風格創造出動態的變化。
  • 任何圖片或文字提示的風格轉換到現有的影片中,創造出不同的視覺效果。
  • 草圖或模型轉換成完整的渲染影片,快速實現創意想法。
  • 影片中隔離主題並用簡單的文字提示修改它們,例如改變顏色、形狀或動作。
  • 未貼材質的渲染影片轉換成真實的輸出,通過圖片或文字提示添加細節和質感。
  • 自定義模型參數,獲得更高保真度的結果。

runaway reserch AI gen-2 是影片生成領域的新標準,根據用戶研究,它的結果比現有的圖像到圖像和影片到影片轉換方法更受歡迎。它為故事和影像創作帶來了新的可能性。

D-ID | 參考文章

D ID 是一個製作人像影片的人工智慧,它可以根據使用者的需求和偏好,自動生成高品質的影片內容。D ID 的主要功能有:

  • 選擇合適的影片素材,包括圖片、視頻、音樂、文字等,並根據使用者的目的和風格,進行剪輯和排版。
  • 生成適合的影片標題、描述、標籤等,幫助使用者提高影片的曝光度和吸引力。
  • 提供多種影片模板和主題,讓使用者可以快速製作出不同類型的影片,例如教學、廣告、紀錄片等。
  • 支持多種語言和字幕,讓使用者可以輕鬆地將影片分享到不同的平台和受眾。

簡單說這網站能幫你的人像圖片加上AI聲音變成影片動起來。

Jasper

Jasper AI是一種內容寫作工具,它使用人工智慧為你生成各種形式的文字,例如社群媒體貼文、部落格文章、行銷文案或電子郵件等 。你只需要輸入一些關鍵字或指令,就可以讓Jasper AI為你創造出符合你品牌語氣和目標受眾的內容。Jasper AI有以下幾個特點:

  • 基於開源的GPT-3 API,這是目前最先進的自然語言生成技術。它可以理解語境和意圖,並產生流暢和有說服力的文字。
  • 整合了Grammarly和Copyscape等工具,可以幫助你檢查文法錯誤和重複內容 。這樣可以確保你的內容是高質量和原創的。
  • 支援25種語言,包括中文、英文、日文、西班牙文等。這樣可以讓你跨越語言障礙,觸及更多的讀者和客戶。
  • Chrome擴充功能,可以讓你在任何網站上直接使用Jasper AI生成或改善內容。這樣可以節省你切換視窗或複製貼上的時間和精力。
  • Boss模式,可以讓你寫出更長更深入的文章。這樣可以讓你展示你的專業知識和見解,提高你的權威性和信任度。
  • 但需要付費才能使用 。根據官網顯示,它有三種方案:每月$29美元(約新台幣800元)可寫10,000字;每月$49美元(約新台幣1400元)可寫50,000字;每月$99美元(約新台幣2800元)可寫200,000字。
  • 而且不能完全取代人類寫作 。雖然它可以生成高質量和原創的內容,但它也可能出現錯誤或不準確的信息。因此,在發佈之前還需要人工校對和修改

可以利用Jasper AI來加速你的內容創作過程,突破寫作障礙,提高轉換率和銷售額 。

Yourator|官方網站

Yourator 新創・數位人才求職平台是一個專為新世代工作者打造的綜合型職涯平台,讓求職者可以透過網站或手機應用程式,快速找到適合自己的數位職缺,並且了解企業的文化、環境、產品和團隊。Yourator 不僅提供豐富的職缺資訊,還有職場專欄、徵才團隊經驗分享、求職攻略等內容,幫助求職者掌握職涯方向,同時幫助公司找到真正認同企業價值的優秀人才。Yourator 的宗旨是拓展求職視野,讓求職者找到自己的理想工作,也讓公司找到最適合的人才。

你可能會問說那我怎麼不直接請GPT幫忙寫就好,但有點是很值得注意的,只要是企業上進行優化的GPT,都會對特定領域回答進行優化,因此他寫出來的內容會更符合你心裡所想的內容!

Cool Gift Ideas|官方網站

這是一個很有趣的網站,你填入送禮對象的特徵,包括他的年紀或喜好他可以推薦給你適合的禮物。

但可惜他目前雖然能輸入中文索取建議,但給出的結果還是英文,玩味性質比較高

YouTube Summary with ChatGPT|連結網址

「YouTube Summary with ChatGPT」是一個免費瀏覽器外掛,適用於 Chrome、Safari ,這項工具主要用途是協助使用者從 YouTube 影片快速獲得摘要(使用 ChatGPT 服務)。

簡單來説,對於影片飛速推陳出新的年代,他能幫你直接把影片字幕文字給你,並且能也能一鍵傳送 ChatGPT 讓 AI 幫忙產生出影片的摘要,可以更快讓使用者理解這段影片的內容。

Good Tape|連結網址

Good Tape 是一個由丹麥 Zetland 新聞網站推出的線上轉錄服務,基於 OpenAI 開源語音識別模型 Whisper 開發用戶端介面,可以幫助使用者將音訊轉錄成文字稿。

Good Tape 目前開放免費使用,介面與操作方式都很簡單,選擇檔案和輸入電子信箱就能上傳音訊提交網站處理,語音轉錄完成會發送電子郵件告知下載連結。

Humata. ai|連結網址

Humata ai 是一個基於人工智慧的 PDF 檔案搜尋和分析平台,旨在幫助用戶從大量文件和數據中提取信息並獲得精確的答案。

你上傳圖片能夠像使用ChatGPT一樣,在旁邊問他你想要知道你訊息,他會以這個PDF內容給你回答!

Boom ai|連結網址

這就是一個自動生成自卡遊戲的網站,輸入關鍵字後會產生很多QA問題,能夠邀請朋友一起同樂!

他的介面是英文,但你在框框裡面輸入中文會自動變成中文的題目喔!

Room GPT|連結網址

Room GPT是一個免費的網站,可讓使用者上傳客廳、浴室、飯廳、辦公室、遊戲室及臥室構想圖,並使用人工智能技術打造實景圖¹。Room GPT使用的機器學習模型稱為ControlNet,可生成房間的變化²。Room GPT提供了5種房間主題風格可選,包括Modern、Minimalist、Professional、Tropical和Vintage¹。

但他目前只有三次的使用額度,可以玩玩看,就能看看自己的房間能改成什麼樣子

Auto GPT|連結網址

Auto-GPT 是一個實驗性的開源應用程序,展示了 GPT-4 語言模型的功能。以下是 Auto-GPT 的重點:

  • 以 GPT-4 作為基礎,使 AI 能將大型語言模型的「想法」串接在一起,可自主達到使用者所設定的目標,不需人公針對每個動作提出指令。
  • 全自動的人工智能系統,其最大的特點在於能夠根據任務指令進行分析和執行,而不需要用戶參與其中的中間環節。
  • AutoGPT相當於給基於 GPT 的模型一個內存和一個身體。

舉個例子:你叫他幫你創建一個部落格,他就會像工程師幫你把整個網站架起來!

Riffusion|連結網址

About the author

我是網路探險家-Miles,我一直對網路的深處充滿好奇心,我是一位喜愛探索網路世界的冒險家。

發佈留言