我在印象筆記中有近萬(wàn)條筆記,因害怕印象筆記出bug或自己誤操作,導(dǎo)致筆記丟失,所以想定期(一周一次)導(dǎo)出所有筆記
的標(biāo)題,用印象筆記自帶功能可以完成標(biāo)題導(dǎo)出,導(dǎo)出到一個(gè)html文件中,然后用代碼讀取到一個(gè)文本文件。
筆記的題目示例如下。
《本地人兩千都不要 炒房者七千買 | 怎么在9個(gè)月把房?jī)r(jià)炒高兩三倍 | 匯率、房貸、外匯儲(chǔ)備…… 杠桿》
《為什么2016美國(guó)大選大數(shù)據(jù)預(yù)測(cè)普遍失靈》
《市面上有一款android的按鍵精靈,他是基于什么原理實(shí)現(xiàn)的實(shí)現(xiàn)? - 知乎》
《linux route 使用詳解》
《linux sort 命令詳解》
使用印象筆記的過(guò)程中,我可能會(huì)修改筆記的標(biāo)題,比如將如上第三個(gè)標(biāo)題的"- 知乎"刪掉。
也可能將不同筆記合并,比如如上的第四條和第五條,合并成《linux route 使用詳解 | linux sort 命令詳解》
如果單單基于如上這些標(biāo)題的話,很難對(duì)一條筆記做唯一性判斷,比如如下刪掉了
",他是基于什么原理實(shí)現(xiàn)的實(shí)現(xiàn)? - 知乎"
后的《市面上有一款android的按鍵精靈》和原標(biāo)題為《市面上有一款android的按鍵精靈,他是基于什么原理實(shí)現(xiàn)的實(shí)現(xiàn)? - 知乎》很難在代碼層面100%確定兩條筆記是同一條筆記(只是基于題目難以確定,實(shí)際上,兩條筆記內(nèi)容是完全一樣的,只是題目變了,但是現(xiàn)階段只能基于標(biāo)題判斷)。
我的初步想法是為每個(gè)筆記的標(biāo)題加上唯一id,如下所示,這樣就能基于id來(lái)判斷:
《id1本地人兩千都不要 炒房者七千買 | 怎么在9個(gè)月把房?jī)r(jià)炒高兩三倍 | 匯率、房貸、外匯儲(chǔ)備…… 杠桿》
《id2為什么2016美國(guó)大選大數(shù)據(jù)預(yù)測(cè)普遍失靈》
《id3市面上有一款android的按鍵精靈,他是基于什么原理實(shí)現(xiàn)的實(shí)現(xiàn)? - 知乎》
這樣搞,原理簡(jiǎn)單,但是有個(gè)缺點(diǎn),需要手動(dòng)更改大量筆記的標(biāo)題,工作量大。
我的問(wèn)題是,還有其他辦法,能讓我如上這么修改了筆記標(biāo)題后,100%確定改過(guò)標(biāo)題后的筆記,實(shí)際上與未改過(guò)標(biāo)題的筆記,實(shí)際上是同一條。
不知道你為什么只選擇導(dǎo)出標(biāo)題?明明可以全部導(dǎo)出成一個(gè)文件然后備份啊。
跟蹤標(biāo)題修改,是為了想知道某條筆記是否被誤刪了(最關(guān)心的是這個(gè))
這樣的話,結(jié)果必然只能是近似的,這一點(diǎn)你必須接受,否則就只能全部導(dǎo)出了。
接下來(lái)就是盡量提升結(jié)果的準(zhǔn)確性,想了一下,下面是我的思路:
標(biāo)題1包含標(biāo)題2或反之。例如:“市面上有一款android的按鍵精靈,他是基于什么原理實(shí)現(xiàn)的實(shí)現(xiàn)? - 知乎”包含“市面上有一款android的按鍵精靈,他是基于什么原理實(shí)現(xiàn)的實(shí)現(xiàn)?”或“市面上有一款android的按鍵精靈”。包含匹配有極大的可能是由原標(biāo)題修改得到的,例如去掉首尾一些內(nèi)容,或在首尾增加一些內(nèi)容等。剩下的就是通過(guò)相似度來(lái)匹配,類似于搜索引擎的關(guān)鍵字搜索。相似度的含義需要花點(diǎn)心思來(lái)定義(找到符合自己應(yīng)用場(chǎng)景的)。我想到的有以下幾種:
北大青鳥(niǎo)APTECH成立于1999年。依托北京大學(xué)優(yōu)質(zhì)雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國(guó)IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國(guó)家
達(dá)內(nèi)教育集團(tuán)成立于2002年,是一家由留學(xué)海歸創(chuàng)辦的高端職業(yè)教育培訓(xùn)機(jī)構(gòu),是中國(guó)一站式人才培養(yǎng)平臺(tái)、一站式人才輸送平臺(tái)。2014年4月3日在美國(guó)成功上市,融資1
北大課工場(chǎng)是北京大學(xué)校辦產(chǎn)業(yè)為響應(yīng)國(guó)家深化產(chǎn)教融合/校企合作的政策,積極推進(jìn)“中國(guó)制造2025”,實(shí)現(xiàn)中華民族偉大復(fù)興的升級(jí)產(chǎn)業(yè)鏈。利用北京大學(xué)優(yōu)質(zhì)教育資源及背
博為峰,中國(guó)職業(yè)人才培訓(xùn)領(lǐng)域的先行者
曾工作于聯(lián)想擔(dān)任系統(tǒng)開(kāi)發(fā)工程師,曾在博彥科技股份有限公司擔(dān)任項(xiàng)目經(jīng)理從事移動(dòng)互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍(lán)懿科技有限責(zé)任公司從事總經(jīng)理職務(wù)負(fù)責(zé)iOS教學(xué)及管理工作。
浪潮集團(tuán)項(xiàng)目經(jīng)理。精通Java與.NET 技術(shù), 熟練的跨平臺(tái)面向?qū)ο箝_(kāi)發(fā)經(jīng)驗(yàn),技術(shù)功底深厚。 授課風(fēng)格 授課風(fēng)格清新自然、條理清晰、主次分明、重點(diǎn)難點(diǎn)突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫(kù),具有快速界面開(kāi)發(fā)的能力,對(duì)瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁(yè)制作和網(wǎng)頁(yè)游戲開(kāi)發(fā)。
具有10 年的Java 企業(yè)應(yīng)用開(kāi)發(fā)經(jīng)驗(yàn)。曾經(jīng)歷任德國(guó)Software AG 技術(shù)顧問(wèn),美國(guó)Dachieve 系統(tǒng)架構(gòu)師,美國(guó)AngelEngineers Inc. 系統(tǒng)架構(gòu)師。