一.生物識別技術(shù)定義
生物識別技術(shù)主要是指通過人類生物特征進(jìn)行身份認(rèn)證得一種技術(shù),即利用人體固有得生物特性,如人臉,指紋、虹膜、掌紋、指靜脈等和行為特征,如筆跡、聲音、步態(tài)等來進(jìn)行個人身份得鑒定。由于人類特征通常具有唯一性、便攜性或終身不變等特點(diǎn)以方便自動識別和身份驗(yàn)證,因此生物識別認(rèn)證技術(shù)較傳統(tǒng)認(rèn)證技術(shù)存在較大得優(yōu)勢。具體來說,生物識別系統(tǒng)是對生物特征進(jìn)行取樣,提取其唯一得特征并轉(zhuǎn)化為數(shù)字代碼,并將這些代碼組成特征模板,通過微處理器和各種電子元器件提高精度,將生物識別系統(tǒng)廣泛得應(yīng)用在各個領(lǐng)域。
二.生物識別技術(shù)和人工智能得關(guān)系
生物識別是人工智能得感知層和入口。
在人工智能產(chǎn)業(yè)鏈中,生物識別是人工智能領(lǐng)域得一種應(yīng)用技術(shù),而且是人工智能領(lǐng)域里應(yīng)用場景較為廣泛得技術(shù)。作為人工智能得感知層,為各應(yīng)用領(lǐng)域和技術(shù)領(lǐng)域采集生物特征數(shù)據(jù);作為人工智能得入口,通過身份認(rèn)證,實(shí)現(xiàn)人工智能“識人”得第壹步。此外生物識別技術(shù)本身又利用人工智能領(lǐng)域得大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)算法技術(shù)來實(shí)現(xiàn)技術(shù)得不斷迭代升級。因此生物識別技術(shù)既是人工智能領(lǐng)域得重要一環(huán),二者又是相輔相成得關(guān)系。
三.全球生物識別市場規(guī)模
華夏生物識別市場規(guī)模從2002年起十幾年間一直保持高速增長,人工智能產(chǎn)業(yè)是從15年起步,2019年進(jìn)入起步期,未來十年將是人工智能產(chǎn)業(yè)競爭得重要窗口期。隨著人工智能產(chǎn)業(yè)得騰飛,生物識別也將迎來更廣闊得市場潛力。MarketsandMarkets蕞新發(fā)布得研究報告顯示,2020全球生物識別市場規(guī)模達(dá)到366億美元,預(yù)計到2025年將增加至686億美元,在預(yù)測期內(nèi)(2020—2025年)得復(fù)合年增長率為13.4%。
四.生物識別技術(shù)商業(yè)化進(jìn)程得關(guān)鍵驅(qū)動
人工智能大數(shù)據(jù)深度學(xué)習(xí)算法和多模態(tài)識別技術(shù)為生物識別技術(shù)提供深層次得支持,是生物識別技術(shù)商業(yè)化進(jìn)程得重要推動因素。
1.深度學(xué)習(xí)算法
在生物識別領(lǐng)域,是通過模擬腦科學(xué)中神經(jīng)元之間信息流得傳播方式,抽象出一種數(shù)學(xué)模型,它可以通過端對端(End-to-End)得訓(xùn)練,從不同得抽象層級提取數(shù)據(jù)得本質(zhì)特征,從而完成復(fù)雜得分類或回歸任務(wù)。此外,深度學(xué)習(xí)算法還能不斷優(yōu)化算法訓(xùn)練,自動學(xué)習(xí)到精準(zhǔn)得表征,形成具有深度得結(jié)構(gòu)模型,增強(qiáng)表達(dá)能力、提高效率。
2.多模態(tài)識別
人類時刻通過視覺、聽覺、嗅覺、觸覺在內(nèi)得多個感官與世界產(chǎn)生交集,其中所包含得每一種信息形式—視頻、圖像、文字、語音、味道、質(zhì)感等都是一種模態(tài)。通過融合人體多種生物特征進(jìn)行身份識別得技術(shù)就是多模態(tài)識別,人工智能不再局限于單一模態(tài)下得交互,可以像人類一樣同時感知多種類型信息,身份認(rèn)證及識別過程會更加精準(zhǔn)、安全,整體系統(tǒng)得性能提高,滿足不同得應(yīng)用場景。
五.生物識別技術(shù)應(yīng)用
目前生物識別技術(shù)已經(jīng)得到廣泛應(yīng)用,按照人體得不同生物特征劃分,可以分為指紋識別、人臉識別、虹膜識別、語音識別、掌紋識別、唇語識別、指靜脈識別、步態(tài)識別等。
按照應(yīng)用領(lǐng)域劃分,主要應(yīng)用于智能駕駛、智能安防、智能家居、智慧城市、智慧校園等場景。利用不同生物識別技術(shù)得特點(diǎn)和各自獨(dú)特得優(yōu)勢,可以滿足不同應(yīng)用場景得需求。
六.常見生物識別技術(shù)得特點(diǎn)與難點(diǎn)詳解
生物特征識別技術(shù)應(yīng)用中,應(yīng)對不同生物特征,可能會選用不同得識別技術(shù),每一種技術(shù)都有其特點(diǎn)和優(yōu)勢,下文以智能駕駛車載場景為例,分析不同生物識別技術(shù)得特點(diǎn)與難點(diǎn)。當(dāng)然,多模態(tài)識別技術(shù)是蕞火爆得發(fā)展方向,正在越來越多得商業(yè)場景落地。
1.人臉識別技術(shù)
●技術(shù)特點(diǎn)
人臉識別技術(shù)可以在較低得畫質(zhì)、較大得偏轉(zhuǎn)角度以及部分遮擋得情況下,迅速得匹配底庫中得數(shù)據(jù),實(shí)現(xiàn)智能化得體驗(yàn)。可以輕松實(shí)現(xiàn)毫秒級得人臉檢測,支持彩色、灰度、近紅外等各種圖像和視頻類型,支持根據(jù)證件自動錄入海量數(shù)據(jù)。可以適應(yīng)側(cè)臉、部分遮擋、表情變化、發(fā)型、妝容、眼鏡、復(fù)雜光照場景等變化。并且具備完善得活體檢測技術(shù),防止2D/3D得惡意攻擊。
●應(yīng)用難點(diǎn)
成像問題:攝像頭需要捕捉到用戶得人臉,成像質(zhì)量較差得情況下,直接影響識別率。通過紅外照明技術(shù),已經(jīng)可以在無感得情況下解決夜晚得人臉識別問題。隨著社會環(huán)境得變化,戴口罩轉(zhuǎn)變?yōu)榈湫蛨鼍?人臉識別解決大面積遮擋問題得同時會引入精度得降低。
攻擊問題:面對采用照片、人臉面皮或者3D頭模做得惡意攻擊問題,視覺算法需要具有完整得活體檢測功能,并且具備較高得精度指標(biāo)。
●人臉識別數(shù)據(jù)解決方案
①2000人臉多姿態(tài)&多表情數(shù)據(jù)集:2000人每人60張多姿態(tài)照片和9張表情照片;不同性別、不同年齡段,不同光照,不同采集環(huán)境;人臉姿態(tài)、人種、性別和年齡得標(biāo)簽標(biāo)注準(zhǔn)確率超過96%;可用于人臉識別,表情識別、年齡檢測等任務(wù)。
②1000人3D活體檢測數(shù)據(jù)集:1,000人每人采集120張照片;多表情、人臉多姿態(tài)、對抗樣本、多種光照條件、多種場景;標(biāo)注人物id、人種、性別、年齡、人臉動作、采集場景、光照條件;可用于3D人臉識別、3D活體檢測等任務(wù)。
現(xiàn)有訓(xùn)練集之外,景聯(lián)文科技可結(jié)合客戶具體業(yè)務(wù)場景、應(yīng)用領(lǐng)域特性,設(shè)計匹配得可用于算法模型開發(fā)、訓(xùn)練、拓展優(yōu)化得人臉數(shù)據(jù)采集標(biāo)注方案。
2.指紋識別技術(shù)
●技術(shù)特點(diǎn)
人得手指末端正面皮膚上凸凹不平產(chǎn)生得紋線,紋線得起點(diǎn)、終點(diǎn)、結(jié)合點(diǎn)和分叉點(diǎn),稱為指紋得細(xì)節(jié)特征點(diǎn)。指紋識別技術(shù)通過分析指紋可測量得特征點(diǎn),從中抽取特征值,然后進(jìn)行認(rèn)證。指紋識別分有光學(xué)式、壓敏式、電容式、電感式、熱敏式和超聲波式等。
●應(yīng)用難點(diǎn)
以智能駕駛汽車應(yīng)用場景為例,汽車更多得工作在是戶外,每天停在外面風(fēng)吹日曬,很容易會因?yàn)橥饷娴酶鞣N因素導(dǎo)致車子得指紋產(chǎn)生不靈敏或者損壞得現(xiàn)象,而且把指紋解鎖得設(shè)備安裝在門把手內(nèi),難以保證不會遭到人為得破壞。如果把指紋識別放在傳統(tǒng)汽車得“無鑰匙進(jìn)入”位置,那指紋信息首先要傳送到“認(rèn)證控制器”,控制器再把認(rèn)證信息傳到汽車得IBU模塊,然后汽車得CPU再通過對比決定是否執(zhí)行開門指令,運(yùn)算時間會導(dǎo)致開車門效率大幅降低,讓人覺得指紋識別不僅增加了成本,降低了安全,還制造了很多麻煩。
●指紋識別數(shù)據(jù)解決方案
①1476人真假指紋采集數(shù)據(jù)集:1476個id1337080張圖像;假指紋采集材料:新型電容膠、固體膠、橡皮膠、指甲油、粘土、掃描打印、銅粉、新型電容膠等60余種;真指紋采集環(huán)境:干燥環(huán)境、濕潤環(huán)境、低溫環(huán)境、強(qiáng)光環(huán)境、不同角度、不同力度按壓。
現(xiàn)有訓(xùn)練集之外,景聯(lián)文科技可結(jié)合客戶具體業(yè)務(wù)場景、應(yīng)用領(lǐng)域特性,設(shè)計匹配得可用于算法模型開發(fā)、訓(xùn)練、拓展優(yōu)化得指紋數(shù)據(jù)采集標(biāo)注方案。
3.行為識別技術(shù)
●技術(shù)特點(diǎn)
通過人體行為識別、高精度三維人臉檢測、目標(biāo)軌跡跟蹤、高精度微表情捕捉及非接觸式生物特征測量等方式,多維度對目標(biāo)行為進(jìn)行檢測,從而保障識別結(jié)果得精準(zhǔn)度。以智能駕駛場景為例,通過檢測追蹤包括頭部朝向、面部表情、視線方向、手勢及肢體關(guān)鍵點(diǎn)等人體視覺特征,分析駕駛員及乘客得身份信息、意圖和行為,技術(shù)需要精確檢測出駕乘人員得身份、性別年齡、五官、視線方向、頭部朝向、手勢、肢體關(guān)節(jié)點(diǎn)等信息以及他們得隨身物品。通過對這些關(guān)鍵信息得檢測,狀態(tài)監(jiān)測技術(shù)可以應(yīng)用在不同得功能上,比如:駕駛員監(jiān)控、乘客監(jiān)控、艙內(nèi)物品檢測和駕艙人機(jī)交互。
●應(yīng)用難點(diǎn)
行為特征屬于高維時序特征,沒有通用得方法有效提取,單個檢測模型難以覆蓋所有需要監(jiān)測得行為。要達(dá)到多種行為得準(zhǔn)確檢測,需要多個達(dá)到一定復(fù)雜程度得檢測模型,也就需要計算系統(tǒng)有比較高得計算能力。目前缺少有關(guān)具體場景得行為視頻數(shù)據(jù)庫,需要采集、制作、標(biāo)注針對訓(xùn)練和測試得數(shù)據(jù),數(shù)據(jù)得建立包含大量標(biāo)注工作,人工標(biāo)注得成本高且費(fèi)時費(fèi)力。
●行為識別數(shù)據(jù)解決方案
①500人駕駛員行為采集數(shù)據(jù)集:多人種、多年齡段、多時間段、多種行為(危險駕駛行為、疲勞駕駛行為、視線偏移行為);采集設(shè)備:可見光和紅外雙目攝像頭;白天、傍晚和夜晚;標(biāo)簽標(biāo)注準(zhǔn)確率95%以上;可用于駕駛員行為分析等任務(wù)。②100人乘客行為識別數(shù)據(jù)集:多年齡段、多時間段、多種行為(正常行為、暈車行為、乘客困意行為、乘客遺落物品行為);可見光和紅外雙目攝像頭;白天、傍晚、夜晚;標(biāo)簽標(biāo)注準(zhǔn)確率95%以上;可用于乘客行為分析等任務(wù)。
現(xiàn)有訓(xùn)練集之外,景聯(lián)文科技可結(jié)合客戶具體業(yè)務(wù)場景、應(yīng)用領(lǐng)域特性,設(shè)計匹配得可用于算法模型開發(fā)、訓(xùn)練、拓展優(yōu)化得行為數(shù)據(jù)采集標(biāo)注方案。
4.虹膜識別技術(shù)
●技術(shù)特點(diǎn)
虹膜識別是基于對人眼虹膜圖像得掃描進(jìn)行身份辨識,眼睛得虹膜形成由遺傳基因決定,利用虹膜得終身不變性和差異性來實(shí)現(xiàn)對身份得甄別。虹膜識別使用紅外攝像技術(shù)獲取圖像得豐富細(xì)節(jié),非接觸性得特質(zhì)帶來更高得效率和更優(yōu)質(zhì)得體驗(yàn)。由于一個人得兩只眼睛得虹膜是不同得,系統(tǒng)掃描一只眼睛進(jìn)行身份驗(yàn)證識別得出錯得概率為百萬分之一,而同時掃描兩只眼睛得出錯概率更會降至萬億分之一,具有更高得準(zhǔn)確率。
●技術(shù)難點(diǎn)
虹膜圖像采集不同于其他識別技術(shù),需要使用可以得設(shè)備,增加了應(yīng)用成本。虹膜識別要求在較小得區(qū)域范圍內(nèi)采集到清晰完整得虹膜圖像,攝像頭得視場角一般比較小,同時對遮擋比較敏感,且系統(tǒng)無法在陽光直射下捕捉干凈得虹膜圖像,光照環(huán)境和安裝布置位置對其影響較大。虹膜對用戶交互配合度得要求更高,目前虹膜可支持得采集距離是1米左右,超過了距離或者被識別物體進(jìn)行以一定速率進(jìn)行移動時識別度就會大幅下降。
●虹膜識別數(shù)據(jù)解決方案
景聯(lián)文科技可結(jié)合客戶具體業(yè)務(wù)場景、應(yīng)用領(lǐng)域特性,設(shè)計匹配得可用于算法模型開發(fā)、訓(xùn)練、拓展優(yōu)化得虹膜數(shù)據(jù)采集標(biāo)注方案。
5.指靜脈識別技術(shù)
●技術(shù)特點(diǎn)
指靜脈識別技術(shù)利用手指內(nèi)得靜脈分布圖像來進(jìn)行身份辨識,是依據(jù)人類手指中流動得血液可吸收特定波長得光線特性,使用特定波長光線對手指進(jìn)行照射,得到手指靜脈得清晰圖像。指靜脈隱藏在身體內(nèi)部,被復(fù)制或者盜用得機(jī)會很小安全等級高,受生理和環(huán)境因素得影響小,克服了皮膚干燥,油污,灰塵,皮膚表面異常等因素適用性強(qiáng)。由于脫離生命主體得手指無法使用,實(shí)現(xiàn)身份標(biāo)識得唯一性。指靜脈識別技術(shù)除了識別速度快,識別精準(zhǔn)之外,對算力得要求比指紋高,比人臉低,對后端得處理器性能要求依賴性不強(qiáng)。
●應(yīng)用難點(diǎn)
受算法限制,指靜脈識別技術(shù)對手指采集區(qū)域有嚴(yán)格要求,如果采集和認(rèn)證時得手指區(qū)域偏差較大,會在一定程度上影響識別得準(zhǔn)確率,甚至是不能互認(rèn)識。目前指靜脈識別產(chǎn)品采用光學(xué)成像形式采集血管圖像,因?yàn)樵O(shè)備尺寸相較于半導(dǎo)體指紋模組偏大,而且需要手指接觸使用,冬天存在凍手影響體驗(yàn)得問題。
●指靜脈識別數(shù)據(jù)解決方案
景聯(lián)文科技可結(jié)合客戶具體業(yè)務(wù)場景、應(yīng)用領(lǐng)域特性,制定匹配可用于算法模型開發(fā)、訓(xùn)練、拓展優(yōu)化得指靜脈數(shù)據(jù)采集標(biāo)注方案。
七.景聯(lián)文科技為生物識別技術(shù)提供一站式數(shù)據(jù)解決方案
景聯(lián)文科技成立于2012年,行業(yè)領(lǐng)先得AI基礎(chǔ)數(shù)據(jù)服務(wù)企業(yè),華夏信標(biāo)委生物特征識別分委會移動設(shè)備工作組成員單位,華夏信標(biāo)委人工智能分委會成員單位。在指紋技術(shù)領(lǐng)域,持有多項自主知識產(chǎn)權(quán)專利及軟件著作權(quán),曾3次參與China標(biāo)準(zhǔn)制定。《互聯(lián)網(wǎng)周刊》&eNet研究院、德本聯(lián)合發(fā)布《2021數(shù)據(jù)標(biāo)注公司排行》,景聯(lián)文科技憑借完備得標(biāo)注管理流程和豐富得項目實(shí)操經(jīng)驗(yàn),榮登2021年數(shù)據(jù)標(biāo)注公司TOP15。
現(xiàn)有數(shù)據(jù)集
自有數(shù)據(jù)庫包含多種類型得數(shù)據(jù)產(chǎn)品。
2000人臉多姿態(tài)&多表情數(shù)據(jù)集;
1000人3D活體檢測數(shù)據(jù)集;
1476人真假指紋采集數(shù)據(jù)集;
500人駕駛員行為采集數(shù)據(jù)集;
100人乘客行為識別數(shù)據(jù)集;
500人唇語視頻數(shù)據(jù)集;
800小時噪音環(huán)境口音普通話手機(jī)采集語音數(shù)據(jù)集;
......
項目經(jīng)驗(yàn)
景聯(lián)文科技目前已在智能安防、智能駕駛、智能家居、虛擬客服、智慧金融,新零售,智慧校園等數(shù)十個場景為客戶提供一站式數(shù)據(jù)解決方案,擁有豐富得場景搭建能力和數(shù)據(jù)采集標(biāo)注經(jīng)驗(yàn)。
在華夏范圍內(nèi)擁有5個標(biāo)注基地,220名全職人工智能訓(xùn)練師,文本、語音、圖像、視頻現(xiàn)有數(shù)據(jù)庫超300TB;并于2020年上線了自有標(biāo)注平臺,涵蓋了絕大多數(shù)主流標(biāo)注工具,支持語義分割、拉框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注、3D點(diǎn)云、2D3D融合標(biāo)注、支持分類、聲紋識別、ASR轉(zhuǎn)寫、韻律標(biāo)注、NLP、文本分類、OCR轉(zhuǎn)寫、情緒判斷等多種標(biāo)注業(yè)務(wù)。
截至2021年,景聯(lián)文科技已與阿里巴巴、華為、vivo、美團(tuán)、字節(jié)跳動、滴滴、陌陌、海康威視、大華、宇視、同濟(jì)大學(xué)、華夏人民大學(xué)、工信部華夏電子技術(shù)標(biāo)準(zhǔn)化研究院、公安部一所等60+企業(yè)、機(jī)構(gòu)達(dá)成深入合作。
數(shù)據(jù)安全管理
成立景聯(lián)文數(shù)據(jù)信息與隱私保護(hù)工作小組,定期組織項目經(jīng)理,質(zhì)檢員,標(biāo)注員進(jìn)行數(shù)據(jù)安全和隱私保密得培訓(xùn)考試,制定完善信息隱私保護(hù)方案,所采集生物特征相關(guān)數(shù)據(jù)集均獲得被采集者書面或電子授權(quán);項目人員辦公場所具備獨(dú)立門禁系統(tǒng)、安防系統(tǒng)和參訪制度,使用WorkWin管理軟件監(jiān)控設(shè)備,標(biāo)注所用電腦安裝USB管控軟件,可按客戶要求禁用指定軟件。保證采集數(shù)據(jù)合規(guī),保護(hù)客戶數(shù)據(jù)隱私。
未來,景聯(lián)文科技也將不斷升級和完善多場景AI數(shù)據(jù)解決方案,為生物識別技術(shù)得發(fā)展貢獻(xiàn)力量,為人工智能企業(yè)提供更優(yōu)質(zhì)得數(shù)據(jù)集產(chǎn)品和數(shù)據(jù)采集標(biāo)注服務(wù)。