在人工智能(AI)的快速發(fā)展中,數(shù)據(jù)標(biāo)注是培養(yǎng)高質(zhì)量AI模型的不可或缺的環(huán)節(jié)。為了完成這項(xiàng)任務(wù),企業(yè)往往會(huì)依賴廉價(jià)的眾包工人進(jìn)行數(shù)據(jù)標(biāo)注工作。然而,最近的研究表明,隨著像ChatGPT這樣的AI聊天機(jī)器人的流行,眾包工人開(kāi)始在數(shù)據(jù)標(biāo)注過(guò)程中使用AI生成的文本。這種轉(zhuǎn)變引發(fā)了人們的關(guān)注和疑問(wèn),為何眾包工人趨向于利用AI生成的文本? 瑞士洛桑聯(lián)邦理工學(xué)院的研究人員進(jìn)行了一項(xiàng)有關(guān)數(shù)據(jù)標(biāo)注的研究,他們招募了44名眾包工人來(lái)對(duì)16篇醫(yī)學(xué)研究論文的摘要進(jìn)行總結(jié)。通過(guò)記錄擊鍵情況,如復(fù)制快捷鍵的使用等,研究人員得出了一個(gè)令人震驚的結(jié)果:他們估計(jì)有33-46%的摘要文本實(shí)際上是由AI生成的。 這一現(xiàn)象引發(fā)了人們的疑問(wèn)和思考。為什么眾包工人開(kāi)始依賴AI生成的文本來(lái)完成數(shù)據(jù)標(biāo)注任務(wù)?其中可能存在多種原因。首先,使用AI生成的文本可以節(jié)省時(shí)間和精力。相比較手動(dòng)撰寫或修改摘要,利用AI生成的文本只需要迅速?gòu)?fù)制粘貼,降低了標(biāo)注過(guò)程的工作量。對(duì)于眾包工人來(lái)說(shuō),這種方式可能更為高效且經(jīng)濟(jì)上更具吸引力。 另一方面,AI生成的文本可能被視為一種"專家"參考。盡管AI模型在某些領(lǐng)域中表現(xiàn)出色,但它們?nèi)匀淮嬖谝欢ǖ木窒扌院筒粶?zhǔn)確性。然而,對(duì)于一些不那么專業(yè)或熟悉特定主題的眾包工人來(lái)說(shuō),他們可能會(huì)傾向于認(rèn)為AI生成的文本具有一定的可信度和權(quán)威性。因此,在進(jìn)行數(shù)據(jù)標(biāo)注時(shí),他們可能更傾向于使用AI生成的摘要文本,以獲得更準(zhǔn)確和專業(yè)的結(jié)果。 此外,還有一種可能是眾包工人從AI生成的文本中尋找靈感和參考。AI模型可以生成大量的內(nèi)容,其中一部分可能是與實(shí)際文本相似甚至具有創(chuàng)造性的。眾包工人有時(shí)可能會(huì)將這些AI生成的文本作為參考,用作啟發(fā)和想法的來(lái)源,并結(jié)合自己的理解和知識(shí)來(lái)完成數(shù)據(jù)標(biāo)注任務(wù)。 這項(xiàng)研究揭示了眾包工人在數(shù)據(jù)標(biāo)注中利用AI生成文本的趨勢(shì),也凸顯了AI技術(shù)對(duì)于傳統(tǒng)人工勞動(dòng)方式的影響。然而,我們也必須認(rèn)識(shí)到,AI生成的文本并非始終可靠和準(zhǔn)確,尤其是在特定領(lǐng)域或復(fù)雜任務(wù)中。因此,在使用AI生成的文本進(jìn)行數(shù)據(jù)標(biāo)注時(shí),仍然需要審慎和謹(jǐn)慎,并結(jié)合人類的智慧和專業(yè)知識(shí)來(lái)確保結(jié)果的質(zhì)量和準(zhǔn)確性。 盡管眾包工人在數(shù)據(jù)標(biāo)注過(guò)程中使用AI生成的文本帶來(lái)了一些挑戰(zhàn)和疑慮,但我們也應(yīng)該看到其中的潛在機(jī)遇。只有在合理利用AI技術(shù)的同時(shí),充分發(fā)揮人類專業(yè)知識(shí)和判斷力,我們才能建立起更加穩(wěn)健、適應(yīng)性強(qiáng)的AI模型,推動(dòng)人工智能技術(shù)在各個(gè)領(lǐng)域的進(jìn)一步發(fā)展。 |
|