真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

如何用Python實現(xiàn)一個論文降重工具

這篇“如何用Python實現(xiàn)一個論文降重工具”文章的知識點大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“如何用Python實現(xiàn)一個論文降重工具”文章吧。

西峰ssl適用于網(wǎng)站、小程序/APP、API接口等需要進行數(shù)據(jù)傳輸應(yīng)用場景,ssl證書未來市場廣闊!成為成都創(chuàng)新互聯(lián)公司的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:13518219792(備注:SSL證書合作)期待與您的合作!

首先需要輸入appid以及key,這些可以在百度翻譯開放平臺申請一個賬號,可以免費申請一個賬號。接著將需要進行降重的文本內(nèi)容復制到相應(yīng)的輸入框內(nèi),點擊開始按鈕,即可輸出不同但意思相近的語句,即達到降重去重的作用。點擊復制按鈕便可以將得到的新文本復制到剪貼板上,點擊清楚按鈕可以重新輸入需要降重的文本,并且循環(huán)往復地進行。

如何用Python實現(xiàn)一個論文降重工具

去重原理

論文查重的粒度是句子,兩個句子的相似度主要取決于句子包含哪些詞,以及詞在句子中的位置。句子相似度只是文字上的對比,不考慮語義上的相近。

正因如此,我們可以采取的措施便是變換句子結(jié)構(gòu),使用近似詞替換。

為了完成這些句子的自動替換,從而達到降重的目的,這里很容易便想到利用不同語種之間的互相轉(zhuǎn)換來生成新文本。比如在本工具中,我采用了中文→英文→韓文→中文的策略,你也可以采取更長的轉(zhuǎn)換路徑,但那樣似乎會在很大程度上降低文本的可讀性。

開放平臺的使用

語句的翻譯我采用了百度翻譯開放平臺的接口,簡單地申請之后就可以獲取每個月200萬的免費字符翻譯權(quán)限。

此API的接入方式略微有些麻煩,需要生成簽名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

以上就是關(guān)于“如何用Python實現(xiàn)一個論文降重工具”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對大家有幫助,若想了解更多相關(guān)的知識內(nèi)容,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。


網(wǎng)站題目:如何用Python實現(xiàn)一個論文降重工具
網(wǎng)站網(wǎng)址:http://weahome.cn/article/iphsic.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部