基于編輯序列的跨語言重構(gòu)檢測(cè)方法

打開文本圖片集
文章編號(hào):1008-1542(2024)06-0627-09
摘 要:
針對(duì)基于深度學(xué)習(xí)的重構(gòu)檢測(cè)方法中開發(fā)人員沒有一致性地記錄重構(gòu)操作,導(dǎo)致提交的信息不可靠以及語言單一性問題,提出了一種新的跨語言重構(gòu)檢測(cè)方法RefCode。首先,采用重構(gòu)收集工具從不同編程語言中收集提交信息、代碼變更信息和重構(gòu)類型,通過代碼變更信息生成編輯序列,將所有數(shù)據(jù)組合為數(shù)據(jù)集;其次,將CodeBERT預(yù)訓(xùn)練模型與BiLSTM-attention模型相結(jié)合,在數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試;最后,從6個(gè)方面對(duì)模型進(jìn)行評(píng)估,以驗(yàn)證方法的有效性。(剩余19392字)