(資料圖)
編程客棧()8月23日 消息:最近, Hugging Face 推出了一個(gè)名為 IDEFICS 的開源多模態(tài) AI 模型,它可以接受圖像和文本作為輸入,并生成連貫的文本輸出。
IDEFICS 是一個(gè)強(qiáng)大的視覺語言模型,擁有高達(dá)800億的參數(shù)量,功能包括根據(jù)圖像生成描述、回答相關(guān)問題以及根據(jù)多個(gè)圖像生成敘述等。
IDEFICS 基于 DeepMind 開發(fā)的 Flamingo 模型,后者是一種目前最先進(jìn)的視覺語言模型,但尚未對(duì)外開源。相比之下,IDEFICS 作為 Flamingo 的開源實(shí)現(xiàn)版本,其測(cè)試結(jié)果顯示在各類圖像理解任務(wù)上其表現(xiàn)與 Flamingo 相當(dāng)。
為訓(xùn)練 IDEFICS,Hugging Face 利用了多種公開的數(shù)據(jù)集,還額外構(gòu)建了一個(gè)包含1.4億張圖像的大規(guī)模圖像-編程客棧文本數(shù)據(jù)集。
IDEFICS 有兩個(gè)版本,包括90億參數(shù)的基礎(chǔ)版和800億參數(shù)的大模型版,可以處理不同的應(yīng)用場(chǎng)景。
IDEFICS 的推出為研究人員和開發(fā)者提供了js一個(gè)強(qiáng)大的開源視覺語言編程模型,相比專利系統(tǒng)如 GPT-3,它提供了更大的靈活性。同js時(shí),IDEFICS 也顯示出生成式模型處理多模態(tài)輸入的潛力。
未來如果能進(jìn)一步提升多模態(tài)理解和生成能力,將可以大幅推動(dòng)諸如機(jī)器人、自動(dòng)駕駛等多模態(tài) AI 應(yīng)用的發(fā)展。
項(xiàng)目網(wǎng)址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground
關(guān)鍵詞:
新聞發(fā)布平臺(tái) |科極網(wǎng) |環(huán)球周刊網(wǎng) |tp錢包官網(wǎng)下載 |中國創(chuàng)投網(wǎng) |教體產(chǎn)業(yè)網(wǎng) |中國商界網(wǎng) |萬能百科 |薄荷網(wǎng) |資訊_時(shí)尚網(wǎng) |連州財(cái)經(jīng)網(wǎng) |劇情啦 |5元服裝包郵 |中華網(wǎng)河南 |網(wǎng)購省錢平臺(tái) |海淘返利 |太平洋裝修網(wǎng) |勵(lì)普網(wǎng)校 |九十三度白茶網(wǎng) |商標(biāo)注冊(cè) |專利申請(qǐng) |啟哈號(hào) |速挖投訴平臺(tái) |深度財(cái)經(jīng)網(wǎng) |深圳熱線 |財(cái)報(bào)網(wǎng) |財(cái)報(bào)網(wǎng) |財(cái)報(bào)網(wǎng) |咕嚕財(cái)經(jīng) |太原熱線 |電路維修 |防水補(bǔ)漏 |水管維修 |墻面翻修 |舊房維修 |參考經(jīng)濟(jì)網(wǎng) |中原網(wǎng)視臺(tái) |財(cái)經(jīng)產(chǎn)業(yè)網(wǎng) |全球經(jīng)濟(jì)網(wǎng) |消費(fèi)導(dǎo)報(bào)網(wǎng) |外貿(mào)網(wǎng) |重播網(wǎng) |國際財(cái)經(jīng)網(wǎng) |星島中文網(wǎng) |手機(jī)測(cè)評(píng) |品牌推廣 |名律網(wǎng) |項(xiàng)目大全 |整形資訊 |整形新聞 |美麗網(wǎng) |佳人網(wǎng) |稅法網(wǎng) |法務(wù)網(wǎng) |法律服務(wù) |法律咨詢 |成報(bào)網(wǎng) |媒體采購網(wǎng) |聚焦網(wǎng) |參考網(wǎng)
亞洲資本網(wǎng) 版權(quán)所有
Copyright © 2011-2020 亞洲資本網(wǎng) All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com