計算機視覺
語義分割是指根據物體的屬性,對復雜不規則圖片進行進行區域劃分,并標注對應的屬性,以幫助訓練圖像識別模型,常應用于自動駕駛汽車、人機交互、虛擬現實等領域。
2D/3D邊界框能夠標注物體在平面或立體中的位置和大小,幫助自動駕駛模型增強視覺和雷達的感知。
關鍵點標注是指通過人工的方式,在規定位置標注上關鍵點,例如人臉骨骼點、場景目標物體等,常用來訓練面部識別模型以及統計模型。
多邊形標注是指在靜態圖片中,使用多邊形框,標注出不規則的目標物體,相對于矩形框標注,多邊形標注能夠更精準地識別目標。
目標跟蹤是指在動態的圖像中,進行抽幀標注,在每一幀圖片中將目標物體標注出來,進而描述它們的運動軌跡,這類標注常應用于訓練自動駕駛模型以及視頻識別模型。
屬性判別是指通過人工或機器配合的方式,識別出圖像中的目標物體,并將其標注上對應屬性。
OCR轉寫是對圖像中的文字內容進行標記與轉寫,幫助訓練和完善圖片與文本識別模型。目前,景聯文支持簡體中文、繁體中文、英語、日語、韓語、法語、德語、西班牙語、阿拉伯語等十余種語言圖片的轉寫。
語音工程
ASR語音轉錄是根據語音內容,轉寫為與之相對應的文本,多用于語音識別模型的訓練。目前,景聯文支持普通話、粵語等地區方言、英語、日韓法德西班牙阿拉伯等小語種的語音轉寫。
聲紋識別標注是將語音人聲中的聲紋特征提取出來,并標注上對應屬性,以幫助訓練語音識別模型。
情緒判斷能夠對語音內容中說話人的情緒傾向進行判斷,區分他們的情感態度,幫助訓練NLP模型。
視頻審核是由人工觀看視頻,審核視頻內容要求是否符合要求。目前,景聯文擁有多個標注基地,能夠實現海量視頻審核,助力智能識別模型訓練。
韻律標注是指從語音數據中確定韻律信息,再對標注文本進行韻律符號標注,常見于語音合成技術。
自然語義
文本分類是指按照客戶的規則,對文本信息進行屬性分類。
文本信息抽取是將完整語句分塊,再將文本中包含的信息進行結構化處理,按客戶規則抽取相對應的內容,方便進一步分析處理。
意圖判斷是指標注員針對文本內容呈現的情緒、意圖、目的進行判斷,幫助訓練NLP模型,常應用于智能客服、智能助手。
序列標注主要包括分詞、詞性標注兩個步驟,先給定文本內容一個序列,再對序列中序列中每一個元素打上對應的標簽。