科大訊飛,你的AI同傳操(qi)作(zha)能更風騷一點嗎

未經作者授權,任何人與機構不得轉載或引用文章內容,作者保留追求法律責任的權利。

2018.09.24

更新:今天科大訊飛聯系我進行瞭解釋澄清,文章鏈接是

今天訊飛給我打瞭個電話 - Bell Wang的文章 - 知乎 http://zhuanlan.icpchaxun.com/p/45258136

內容如下:

這篇文章因為是整理語音交流內容,可能會比較亂。如果有人覺得太長不願意看,可以跳過中間直奔結論。

昨天,我得知科大訊飛想要和我進行溝通,將事情來龍去脈解釋清楚並澄清一些誤會。我覺得這樣做確實會讓事情清楚一些,比兩邊隔空喊話要高效很多,於是就答應瞭。

今天,我就與科大訊飛消費者事業群副總裁,聽見科技總經理王瑋女士進行瞭語音溝通。整個交流持續瞭大約一小時十分鐘。我們雙方都留瞭錄音。

一開始我先解釋瞭下在文章中我的一些激烈用詞(囧),確實是情緒有些激動,比較不好意思,然後我就提出瞭在我文章中主要的幾個問題。一個就是現場字幕的問題,事先我並沒有得知有訊飛參與,也沒有人征求我的同意,並且隻有“訊飛聽見”幾個字還是很容易讓觀眾誤解為是訊飛提供的字幕翻譯,也會讓同傳譯員誤解,感覺受到不尊重。二是直播的同傳音軌使用tts語音合成而不是直接用同傳譯員的翻譯音軌,同時知領的直播介紹中的文字說有“智能翻譯”功能,對觀眾非常有誤導性,有欺騙嫌疑。同時還提到瞭我後來想到的一點,就是訊飛作為這樣一個大影響力的公司,是不是在營銷和公關上控制不足,導致很多誤會。

王女士先解釋瞭第一點。訊飛聽見之前也在幾次比較有影響力的會議上有所使用,應該已經有不少人熟知,而這次的會議其實有很多的承辦方,並且有會務公司和翻譯公司的參與。王女士表示科大訊飛在多次的籌備會議中明確要求要通知到所有相關方會有訊飛聽見的字幕技術應用和展示,是不是哪一環溝通出現瞭問題。這一點上,我倒確實後來聽相關方說,跟我確定會議相對晚,據說其他譯員老師被通知瞭,可能是因為我確定晚漏瞭我一個。那這點上我覺得這個解釋可以接受,但遺留的問題就是,這種情況下造成的誤解不僅針對譯員,在現場關註會議的聽眾,新聞報道的受眾,以及網上直播的觀眾都可能會誤解為翻譯是訊飛提供,因為不是所有人都熟悉訊飛聽見。

第二點第三點牽涉的問題就比較復雜。王女士解釋說其實他們考慮過如果用人工語音來替代翻譯的語音確實會比較奇怪,(同時也向我提問,是否以後遇到這種情況可以尋求同傳譯員的許可,打出老師的名字或貼上老師的照片,或至少用文字標識表明有同傳譯員在翻譯。這一點後面我們進行瞭討論。)但最終結果是經過討論,訊飛還是提供瞭tts的技術支持,目的是為以後可以實現的多語言平臺進行演練(這裡王女士解釋瞭,比如一共有五種語言的與會者,可能一個小語種找不到翻譯,那麼可以借由其他譯員翻譯出來的文本作為中心語言,然後文本翻譯到該小語種,再人工語音輸出)。所以訊飛就提供瞭技術支持,但後續沒有進行足夠的把控,造成瞭譯員感受到瞭侵犯,確實考慮不周。

我就進一步提出,後續沒有控制,如果真是本身沒有這種意願,最終出現這種情況,那其實就是訊飛的營銷或是公關部門工作問題,如果控制得好些,完全可以在同傳語音保留的情況下增加第三個tts的頻道,在對比下更能展示技術。王女士承認這方面確實本應做得更好。

然後我跟著說,訊飛確實官方多次聲明提到過沒有取代人工同傳的意思,那麼基於這種考慮,營銷和公關部門應該是在媒體誇大炒作之後盡快進行辟謠和澄清,而不是等到誇大宣傳激起激烈反彈後再應激式地去救火,還會讓人感覺是訊飛默許瞭這種誇大宣傳,客觀上還從中得到瞭好處。而且輿論先受到瞭媒體炒作的影響(同時訊飛澄清不夠),覺得訊飛的AI技術已經無所不能,遠超訊飛自己的定位,結果這次出瞭這樣的一個事件,很可能很多人態度又會180度轉彎,瞬間覺得訊飛一無是處。王女士回答說確實作為一個科技公司在這方面缺乏經驗,這次也是第一次他們遇到這麼大的輿情事件,讓他們感覺也很被動。而且現在社會中輿論容易被媒體影響,信任危機讓人們很容易由於一次事件就完全失去信任。我就提到,訊飛作為多種程度上承載很多中國人希望的公司,如果不能做到對於這樣的社會現狀有準確的判斷,進行前瞻性的準備而不是放任事情直到出事再救火,那麼工作肯定是有問題的。王女士承認這是一次教訓,事先的管控確實出現瞭問題,以後在面對可能的類似事件之前也需要進行預防性澄清。

至此第二點和第三點解釋完畢。

在結尾我們還做瞭更多溝通。我提到在同傳的業界中,(不論是否由訊飛導致)曾經出現過不止一次譯員“被AI”,感覺到被免費利用,也有講者在會上講類似“感謝這次的人工智能同傳,相信人類很快就要被取代”的話。王女士這時主動提出,她也聽到過同傳界或翻譯公司的建議,是否應該在以後牽涉到訊飛提供技術的會議中,要與譯員溝通,得到知情同意並簽訂協議。我說確實需要這個機制,而且協議需要分為兩部分,第一部分是對於訊飛在會場提供的技術支持進行解釋,包括呈現方式和運用的技術和其用途,需要得到譯員的同意,並且需要在會場明確進行標識,說明翻譯由譯員提供;第二部分是關於譯員翻譯出來的內容,如果需要後續使用該內容(如用於語料積累或模型訓練等),必須得到譯員同意,否則不可使用。也就是說,一定要規范。王女士說,訊飛將探索這種機制的建立,並盡快執行。

另外,因為這次影響很大,很多我的同行都各自發聲,有相對些激進,有些相對克制,我建議訊飛可以找機會跟同傳界多進行正式的溝通,爭取解除不必要的誤會,尋求真正合作的可能。

總結:

我覺得科大訊飛的王瑋女士展現出瞭誠意,溝通過程中一直友好理性。這次的解釋是讓我能夠接受的,從我的角度看,可以認為訊飛沒有主動造假的行為,但是訊飛的營銷和公關存在比較大的問題,客觀上放任瞭媒體的過分宣傳,導致瞭各方的誤會。

訊飛表示在以後的工作中需要更有前瞻性,在營銷和公關的把控上必須嚴格,要在發現媒體過度宣傳的時候就盡早進行澄清,並且在以後可能的技術呈現過程中充分做好標識,避免誤會。

最後我們進行瞭更多交流,我提出建議,訊飛在未來與譯員可能合作時,需要得到譯員的知情同意,並簽訂協議,而且需要應用譯員知識產權的翻譯內容時,也需要得到許可,否則不可使用。訊飛承諾將盡快探索這一機制並執行。並且,這次事件激發瞭很多來自業界的討論,我也提出希望訊飛能主動進行聯系溝通進行澄清。

最後補充幾句題外話:

本身我寫前一篇文章的時候,考慮得也十分簡單,就是感覺受到瞭不公的待遇,要將自己的經歷寫出來。而且當時多少情緒也比較激動,有些措辭比較激烈。結果後來自然也被解讀瞭,還有人說我是“帶著任務來的”。之後事情影響越來越大,各個媒體,甚至外媒都開始報道以及引用我的文章。不僅如此,業內的朋友們也開始在我身上寄托很多期望,希望維護合理的權利和訴求。這時我才意識到,發聲一定要謹慎,即使我描述瞭事情的經過,但幾句不謹慎的話還是會引起麻煩。於是我決定不再評論回復(看都不看瞭,免得心煩),也拒絕瞭所有媒體的采訪請求。這裡還是再說一遍,我從未委托任何人代替我發聲,我自己說的也僅僅代表我自己,我也沒有權力代表同傳行業,我隻能從自己的角度去聆聽,並得出自己的結論。但這次我覺得最有價值的還是結尾的討論。澄清事件解釋誤會都隻是對過去的總結,關鍵還是在於事件能否對未來有積極的影響。如果這次事件真的能建立事先溝通機制,保護好譯員的權利,規范化知識產權的使用,並且能讓大傢理性看待AI技術,不要不理性地拔高或貶低,那我覺得這次事件就不是一次鬧劇,而是一次真正產生價值的事件。

這次應該還是會不看評論不回復。

—————————————————————————————————

2018.9.21

修改:視頻進行瞭修改。不再回復評論

2018.9.20

今天一早來到國際會議中心,本以為就是日常做會的一天,沒想到被深深惡心瞭一把。

剛箱子裡坐下,就聽說要直播。我想,哦好吧,反正不是第一次。我們收拾收拾就準備開會瞭。

第一位教授是位日本教授,英語非常的酸爽。因為要直播嘛,我們肯定比平時更緊繃一些,這時我就註意到兩邊大屏幕下有實時字幕。

而且赫然看到“訊飛聽見”四個大字。我心裡就有點煩。之前訊飛炒得最兇的時候我沒怎麼說話,隻是轉瞭轉同行“被AI”的朋友圈,心想哪天我要是遇到這種一定搞死他們。結果沒想到他們事前不和我說當場給我來這套突然襲擊。

然後我又仔細審視瞭一下字幕

3575d5154702f445930fb85677b5d1d2

嗯,看來不太聽得懂日本教授的英語,哦應該可以說是胡話連篇瞭。再看瞭看左邊

ed660260010f5218dbd5ba7f4be46f8d

這個完全就是語音識別的我搭檔的輸出啊,不然“就是”這種詞怎麼會出現在譯文裡呢?這種詞是我們順句驅動時用於聯系語句用的。而且當翻譯到說分析“步態”的時候,上面顯示“不太”,在我翻譯“Davos Forum”的時候,上面顯示“Devils Forum”,完全和源語言內容對不上啊,就自然不可能是翻譯瞭。

到這裡我心裡就很不爽瞭。因為從觀眾的角度來看,右邊有英語識別(雖然經常不通),左邊有譯文(雖然經常跟右邊對不上),加上“訊飛聽見”幾個大字,那肯定是科大訊飛牛逼的AI翻譯啊!而且我甚至能腦補出科大訊飛被戳穿後的辯詞:“我們這次使用的產品是訊飛聽見,識別同傳的翻譯打在屏幕上方便聽眾,並無意冒充AI同傳,對惡意造謠者,我們保留訴諸法律的權力”之類的,感覺真的無言以對。

但是會議畢竟在進行,我們也隻能吃到蒼蠅咽下去默默忍著好好翻譯。其實過程中我也真考慮過得空的時候在話筒裡說“本次翻譯由同傳譯員王xx提供”之類的,但最終想想還是算瞭,到時候人傢倒打一耙說其實很尊重同傳,我這麼一來是給科大訊飛潑臟水,被害妄想,人傢根本沒這個意思,那就更惡心瞭。想到這裡我就覺得還是算瞭,就好好翻完就得瞭。

然後好戲開始是在下午。我在翻譯一輪換下來之後得知,說這個會在知領有直播,裡面有同傳。但是!裡面的聲音是機器人,讀的就是翻譯被訊飛識別轉化成的文本!!

我看瞭這個氣得汗毛都立起來瞭,這就是赤裸裸的欺騙啊!明明就是我們輸出的翻譯內容,不給我們原音放出去,一定要把語音識別的文本(還各種錯誤)用機器人讀?然後我們同傳農藥群的小夥伴發現瞭這個:

科大訊飛智能語音技術,“智能翻譯”瞭解一下

是的沒錯,訊飛號稱這是他們的智能翻譯。這時候我真的已經忍不瞭瞭,於是我就電腦打開瞭直播頁,放在外面,自己用手機在翻譯間裡錄下現場畫面和翻譯,然後出來拍電腦,打開音量。結果,由於直播有延時,完美拍到瞭科大訊飛復讀機,哦不對,朗讀機的表現。

註:這裡的視頻進行瞭更換,第一段視頻是原來的第一段視頻截取機器語音部分;第二段視頻截取機器語音部分價值不大,我就放上瞭一段新視頻,依然隻有機器語音部分。

19e6522f34c9c6672cdfedf3fa757898http://www.icpchaxun.com/video/1026585668213886976

這裡首先是講者說可以挖掘數據,放入圖表,翻譯內容是"I can mine this data and put it in charts(我可以挖掘數據並放入圖表) to represent the status of the machine, we call it initial monitoring(以此表示機器的狀態,我們稱之為初步監控)",但訊飛識別成瞭"minus data(減數據?)"和"put it in charge(讓它負責?)"甚至是“college condition monitoring(大學狀態監控??)”,我們看直播流中的同傳毫不猶豫地按照錯誤的識別文本讀瞭出來。很顯然,mine this讀音接近minus,put it in charts接近put it in charge,然後大概是call it給識別成瞭college。這些內容語音很接近,但是意思完全對不上。如果真是翻譯,那對比下源語言內容,minus、in charge和college從何而來?

http://www.icpchaxun.com/video/1026587582792110080

這段視頻,問題主要是15秒開始,本身譯文應該是"we give the data and try to analyze them and try to figure out the issues within the machine.(我們給予數據,分析它們,並努力找到機器的問題)"但是是機器識別成瞭“analyze some(分析一些?)”。這自然也很清楚,them發音是接近some的,但是把some放在這裡是完全語義不通。所以顯然這個機器語音是在朗讀文稿而不是進行翻譯。

收集完瞭這些證據我第一時間就開始寫這篇文章,要揭露一下所謂智能翻譯的真相。而且我要鄭重說一下,科大訊飛事前沒有告知有語音識別的字幕,沒有告知直播的同傳是機器朗讀同傳經過識別出來的文稿,更沒有征得同意就冒名使用瞭譯員翻譯成果,這種行為,不知道有沒有哪位懂得法律的朋友告訴我算不算侵犯知識產權呢。當然我對於我國目前的法制,尤其在知識產權方面真的不是很自信,應該不會有後續的追責,但我覺得必須要在各個社交媒體平臺上把這件事亮出來,讓大傢看看。這次會議是免費向公眾直播,不存在保密問題,也正好是一個機會讓大傢見識一下科大訊飛的實力(當然瞭,萬一產生瞭點影響還能見識下科大訊飛的公關能力)。

也許有一天AI真的能做到理解自然語言,也許有一天我們這個職業會失業,但絕不是現在;真正突破性的技術也不可能由一個沒有操守的公司研發出來。技術是無罪的,但以技術為名吸引資本的目的會不會導致虛假包裝和營銷呢?呵呵呵呵。

发表回复

相关推荐

關於達佈和【定理】的證明歷程

0. 寫在前面第一次編輯: 第一次用 rm LaTeX 排版寫文章,格式爛得一批,輕噴。畢竟各位都是學習知識的,排版能看就行吧第二次...

· 1分钟前

長胎記有福氣?這種胎記會癌變的!

寶寶出生屁股上大塊的淤青,身上甚至臉上各種紅色、粉色、咖啡色等等不一樣的斑痣,這些都是怎麼形成呢?難道真的是傳說“上帝...

· 2分钟前

2023年当涂县公办幼儿园劳务派遣制专任教师公开招聘公告

为进一步加强幼儿园教师队伍建设,促进当涂县学前教育事业发展,受当涂县教育局委托,马鞍山姑溪劳务服务有限公司负责承办本 ...

· 4分钟前

天干地支60型人格(十九)五行旺相休囚死及十二生旺死绝表探源

十二生旺死绝表 十二生旺死绝表是从五行旺相休囚死来的。 我认为,五行旺相休囚死讲的是月气,一年十二月 十二生旺死绝表 ...

· 5分钟前

每日一犬 · 喜樂蒂牧羊犬

喜樂蒂牧羊犬喜樂蒂牧羊犬在英國和美國的受歡迎程度遠遠超過柯利牧羊犬是最受歡迎的十種傢養犬之一喜樂蒂牧羊犬 肩 高:33cm-...

· 6分钟前