text n. 1.原文,本文,正文;(文藝學等所說的)文本。 2.課文,課本,教科書。 3.基督教圣經(jīng)經(jīng)文,經(jīng)句〔常引作說教題目〕。 4.主題,論題。 5.(歌譜的)歌詞。 6.版本。 7.=text hand. a full text 全文,正文。a text in physics 物理課本。 stick to one's text (談話)不離本題。
segment n. 1.(自然形成的)段落;斷片;部分;分節(jié);段;節(jié)。 2.【數(shù)學】(線)段;弓形。 3.圓缺;球缺。 4.環(huán)節(jié);切片。 5.【生物學】分裂片;體節(jié);環(huán)節(jié);【植物;植物學】細裂片;全裂片。 6.【電學】整流子片;【計算機】程序段;【機械工程】扇形體;弧層;拼合輪緣。 a segment of an orange 橘子的一片。 the jointed segments of a bamboo stem 一根竹子的許多節(jié)段。 in segments 成節(jié)[段],分節(jié)[段]。 vi. 【生物學】分裂。 guide segment 弓形座。 mica segment 云母片。 vt. 分割,分裂;【生物學】使分裂。 a segmented worm 環(huán)蟲。
The proposed model takes into account the subtopic structures of documents . it first splits the documents into text segments with texttiling and calculates the similarities for different pairs of text segments in the documents . lastly the overall similarity between the documents is returned by combining the similarities of different pairs of text segments with optimal matching method 該模型首先采用texttiling技術(shù)將文檔分割成能代表子主題的文本塊,然后計算兩個文檔中不同文本塊之間的相似度,最后通過圖論中的最優(yōu)匹配方法綜合文本塊之間的相似度得到兩個文檔之間的總體相似度。