哥倫比亞大學:通過培訓機器將人們聚集在一起,以更好地了解我們的差異
在電視上,這是一個常見的喜劇比喻:文化差異導致溝通中斷。這是一個典型的場景:兩國官員次見面。一個代表團贈送了一份對方欣然接受的禮物——但他們沒有回報的文化敏感性,他們所有的好意都很快從那里瓦解了。在電視節目中觀看可能很有趣,但在現實生活中,這種情況可能是災難性的,甚至可以避免。 哥倫比亞大學的研究人員與來自加州大學戴維斯分校、紐約大學、伊利諾伊大學厄巴納-香檳分校和石溪大學的同事合作,正在著手了解跨文化互動如何以及為何會失敗,以及可以采取哪些措施來解決躲開它。由哥倫比亞大學工程計算機科學教授Kathleen McKeown領導,他們從國防研究計劃局 (DARPA) 獲得的 500 萬美元撥款將開發無監督模型,旨在學習跨多種文化和語言的社會文化規范,然后分析沖突規范如何導致談話脫軌和誤解發生。他們將這種新系統稱為“通過影響和反應調解實現跨文化和諧”或 CHARM。 為期三年的 CHARM 研究項目初將專注于中國文化中的普通話,并在以后的幾年中擴展到包括其他語言和文化。該研究的主要數據收集將是從互聯網上獲取的中文視頻——多語種真人秀節目、采訪錄音和小組會議視頻。 目的是建立一個可以幫助拓寬領域和改進現有語言模型的語料庫。即使現在有許多可用的語言模型,例如 GPT-3,但該技術還沒有出現。McKeown 說:“近年來,自然語言處理有了很大進步,但語言模型不能直接開箱即用。他們需要接受培訓以避免偏見,并且需要增加新的目標,這樣他們就不會產生令人驚訝的輸出。” McKeown 是 Henry 和 Gertrude Rothschild 計算機科學教授和自然語言處理 (NLP) 專家,在文本摘要領域處于地位,并建立了將大型文本(如新聞文章)自動總結為簡短易懂的流程和模型- 閱讀摘要。 近,她的研究興趣已擴大到包括如何使用 NLP 來解決社會需求。由于互聯網和社交媒體上有大量數據可用,McKeown 有各種項目來分析社交媒體以洞察世界。她近獲得了 2023 年 IEEE 社會基礎設施創新獎,以表彰她分析社交媒體和突破 NLP 界限的研究。 McKeown 與前哥倫比亞社會工作學院社會工作和社會學教授 Desmond Upton Patton 合作現在是賓夕法尼亞大學的 Penn Integrates Knowledge 教授。作為槍支暴力、青少年社交媒體使用和定性方法方面的專家,Patton 在過去幾年與 McKeown 合作開展了許多專注于社交媒體上黑人數字表達的項目。他們研究的一個決定性特征是他們與社區互動以了解黑人如何在線表達悲傷的獨特方法。例如,在一項研究芝加哥幫派成員如何使用社交媒體表達悲傷的合作中,他們直接與當地青年和幫派成員合作,以更深入地了解包含表情符號和該群體特有術語的推文。對于這項工作,
凱瑟琳麥基翁和德斯蒙德厄普頓巴頓 他們的研究集中在黑人社區,因為大多數關于理解悲傷的研究都是基于美國白人,這意味著人們對黑人如何使用社交媒體來表達、處理和應對悲傷知之甚少。流行病、警察的暴行和失去親人可能會導致人們難以應對的創傷性反應。McKeown 和 Patton 看到了創造創新計算工具來幫助識別和解釋悲傷表達的機會。 他們的另一個項目,識別和理解黑色悲傷的數字表達,將開發一個系統,該系統可以開發工具,自動識別悲傷的數字表達,然后社會工作者和衛生專業人員可以將其用于干預和計劃。 對于同樣專注于社交媒體的科學基金會的新撥款 120 萬美元,他們設計了一種新的多層次方法來注釋他們的工作——首先,他們將要求參與者提交關于他們的感受的類似日記的提交,然后語言學家將審查這些條目,以更好地了解他們如何使用語言來傳達他們的感受。悲傷障礙專家M. Katherine Shear將與一些參與者坐下來深入探討他們的感受和意義。他們將與非營利性民權和信仰組織 Mobilizing Preachers and Communities (MPAC) 合作,確定多達 50 名黑人哈林區居民參與這項研究。 該團隊創建了一個網站,參與者可以在其中寫下他們對日常事件的反應。除了大流行的負面情緒影響外,黑人還會經歷種族主義和其他社區特有的困難。該項目將重點分析這個社區如何使用非裔美國人的英語來表達悲傷,以及哪些事件引起了他們的感受。希望這種更細致入微的方法將產生更豐富的非裔美國人英語語料庫,進一步目標是確定需要幫助或的情況。 McKeown 和 Patton 之間的伙伴關系成功的原因之一是他們相互理解并且他們的工作是協同的。他們每個人都將自己的專業知識帶到他們的項目中。巴頓和他來自社會工作學院的博士生一起,通過社會工作和社會學的視角來思考一個項目,這種視角更加定性——人們如何以及為什么會以他們的方式感受和行動。McKeown 和她NLP 小組的學生擁有計算專業知識,以及對機器學習和自然語言處理的理解。 她與巴頓的工作性質使他們談論敏感話題。在他們早期的工作中,他們意識到計算機模型將 N 詞歸類為攻擊性和負面術語。Patton 分享說,N 詞在黑人社區中不一定是負面的,因此不應歸類為負面。這導致他解釋了黑人社區為什么以及如何使用這個詞和社區的其他文化方面。巴頓說,“我們不得不就種族主義和文化進行一次不舒服的對話,但由于我們彼此之間的對話,我們的工作要好得多。” 巴頓回憶說,當他 2015 年次來到哥倫比亞時,他聯系了幾位教授,看看他如何與他們合作開展研究。McKeown 是愿意與他交談的計算機科學教授。McKeown 記得她對巴頓展示的工作感到非常興奮,以至于她立即知道她想和他一起工作。從他們次見面開始,兩人就一拍即合,并開始研究黑人的經歷。他們是少數幾個專注于這一領域的研究團隊之一,巴頓將他與 McKeown 的跨學科合作歸功于他在大學獲得終身教職的原因之一。 “我不得不說,來到一所新學校并成為一個試圖進入計算機科學和工程領域的有色人種是非常可怕的,”巴頓說。“很容易與 Kathy 建立聯系并向她學習。在這個領域,她一直是我的良師益友,我認為,她是教員應該如何與初級教員聯系的典范?!?/span> “我們對我們這的事件如何影響人們感興趣,”麥基翁說。“由于流行病、社會正義和種族主義襲擊等社會問題,過去兩年對許多人來說都很艱難。但我們還沒有看到這些日常事件如何影響人們的持久情感影響?!?/span>