Uipath Marketplace

はじめてのオートメーションをわずか数分で作成できます。Studio Web を試す

Cosine Similarity

Cosine Similarity

作成者: Adharsh Chandran J S

2

アクティビティ

ダウンロード数

421

[戻る] ボタン
[戻る] ボタン
carouselImage0
[次へ] ボタン
[次へ] ボタン

要約

要約

Cosine similarity is a metric used to determine how similar the documents are irrespective of their size

概要

概要

A commonly used approach to match similar documents is based on counting the maximum number of common words between the documents.

Still, this approach has an inherent flaw: as the size of the document increases, the number of common words tends to grow even if the documents cover different topics.

The cosine similarity helps overcome this fundamental flaw in the ‘count-the-common-words’ or Euclidean distance approach.

Input:

  • TestingDocumentText - string containing the text content to be tested
  • TrainingDocumentText - string containing the text content to be trained

Output:

  • CosineSimilarityValue - decimal value ranging between [0-1]

機能

機能

The cosine similarity is advantageous because even if the two similar documents are far apart by the Euclidean distance because of the size (like, the word ‘cricket’ appeared 50 times in one document and 10 times in another), they could still have a smaller angle between them. Smaller the angle, higher the similarity.

その他の情報

その他の情報

依存関係

Centivus.EnglishStemmer.dll

コード言語

Visual Basic

ランタイム

Windows レガシ (.Net Framework 4.6.1)

公開者

Adharsh Chandran J S

公開者ページを表示

ライセンス契約とプライバシー条項

MIT

プライバシー条項

技術情報

バージョン

1.0.1

更新日

2020年4月21日

対応製品

Studio: 19.4.4 - 22.10

認定

シルバー 認定済み

サポート

UiPath コミュニティ サポート

類似のコンポーネント