SCROLL
CMS提供企業様や大量クライアント保有企業様向けに、ミエルカで培ってきた自然言語処理・機械学習の技術をつかった、 文章解析/生成/推薦アルゴリズムのAPI提供をしています。自然言語処理・機械学習(人工知能)の機能を自社サービスに 取り入れたい企業様に最適です。
■運用の流れ
大量の文章からニーズを含む文章を抽出し ます.アンケート結果やWebページなどか ら,どのようなことが求められているかを 抽出できます.
サイト回遊率を増やす手助けをします.AIが 自動で,サイト内のページから関係のあり そうで踏んでくれそうなページへのリンク を提案します.
Web上のコピーコンテンツを監視し検知し ます.自社のコンテンツが真似されていな いか,ライターがコピペで記事を作ってい ないかが判定できます.
Webコンテンツなどの日本語の文章から, おかしな場所を自動で指摘します.コンテ ンツの校正やあまり使われない表現の抽出 などに使えます.
人間的な発想で語を拡張します.テーマの 拡張や関連語の発掘,リコメンドエンジン のコアなどに使えます.
キーワードからそれっぽい質問文を生成し ます.キーワードについて,どんな悩みが あるのかなどの分析に使えます.
人工知能(AI)の一分野である「自然言語処理」を応用し、検索ユーザーのニーズを抽出・分析、評価されやすいコンテンツづくりを的確に支援するWebマーケティングツール。クラウド上で「自社サイトの改善すべきページの抽出」「ライバルサイトとの差異の発掘」など、主にWebコンテンツ改善に活用できる機能が豊富。
SEE DETAILS
ミエルカヒートマップは、サイト流入後の来訪ユーザーの行動を可視化し、WEBサイトのボトルネックをわかりやすく色分けで判別する事が可能なサービスです。
無料からお試しすることができ、リリース依頼数千のお客様にご活用いただいております。
人工知能・機械学習・自然言語処理周辺の技術情報のメディアを運営しています。
基礎的な技術の解説から、ビジネス応用まで様々な方に向けて記事を展開しています。
SEE DETAILSストップワードの除去は自然言語処理やテキストマイニングにおける重要な作業です. 解析の精度を上げるために不要な記号や単語を等をデータセットから除去します. ストップワードの選定にはタスクに特化した分析が必要ですが,ある程度整理されているデータがあるととても助かります. そこで,今回は私が自然言語処理のタスクでよく行う,日本語のストップワードについてまとめました. また単語の分布などから,品詞ごとのストップワードに対する考察も行いました. このことからストップワードを介して自然言語処理のあまり語らることのない知識などをご共有できればと思います. (この記事の考察部分は主に自然言語処理の初心者を対象とした入門記事です.) 目次 1. 自然言語処理・ストップワードとは 2. 分析の対象 3. 単語の分布に対する考察 ┣ 出現頻度 上位300件 ┗ 出現頻度と単語 4. 品詞ごとに考察 ┣ 名詞 ┣ 動詞 ┣ 副詞 ┣ 助詞 ┣ 接続詞 ┣ 記号 ┣ 助動詞 ┣ 感動詞 ┣ 感動詞 ┗ 連体詞 5. 便利な正規表現 ┣ ひらがな ┣ カタカナ ┣ 漢字 ┗ 常用漢字一覧 6. おわりに 自然言語処理・ストップワードとは 自然言語処理… Read More »
The post 【自然言語処理入門】日本語ストップワードの考察【品詞別】 appeared first on ミエルカAI は、自然言語処理技術を中心とした、RPA開発・サイト改善・流入改善レコメンドエンジンを開発.
平素は大変お世話になっております。 ミエルカAIブログ 編集チーム一同です 本記事(https://mieruca-ai.com/ai/fisherian-bayesian/ ※現在は内容非公開)の内容に 誤りや誤解を招く表現が、ございました。 つきましては、指摘いただいたご記載含め、 まずは、記事内容の取り下げを早々に行いました。(2019年7月16日10時35分) 今後、内容につきましては、鋭意検討していく所存です。 お手数をおかけしまして、恐縮の至りではございますが 何卒よろしくお願いいたします。 この度は、多大なるご迷惑をおかけしましたことを 心よりお詫び申し上げます。 今後このようなことのないように徹底してまいります。 どうぞよろしくお願いいたします。 ミエルカAIブログ 編集チーム一同
The post 記事内容に関するお詫び appeared first on ミエルカAI は、自然言語処理技術を中心とした、RPA開発・サイト改善・流入改善レコメンドエンジンを開発.
今回は潜在意味解析(Latent Semantic Analysis: LSA)を確率的に発展させたトピックモデルの確率的潜在意味解析(PLSA)について解説します. このモデルを使うと潜在的な意味をトピックとして抽出でき,そのトピック内で単語と文書が出現する確率がわかります.主に既存のデータの分析に用いられています. 目次 確率的潜在意味解析(PLSA)とは PLSAのアルゴリズム PLSAの学習 EMアルゴリズム (E-step) EMアルゴリズム (M-step) 過学習の対策 (TEM) LSAとPLSAの比較 PLSAでの分析例 PLSAの応用 PLSAの問題点 参考文献 確率的潜在意味解析(PLSA)とは 確率的潜在意味解析(Probabilistic Latent Semantic Analysis: PLSA)とは,1999年にHofmannらが発表したトピックモデルの代表例である.トピックモデルは,文書は複数の独立した潜在的なトピックから成るものとして,その過程を確率分布を用いてあらわした確率モデルである. 例えば,「車中泊」についての文章は「自動車」や「キャンプ」などのトピックからなると考えられる.「自動車」から単語「車」,「車内」,「座席」が生成され,「キャンプ」から単語「泊まる」,「水」,「自炊」,「寝る」が生成されたとする.その場合「車中泊」についての記事の単語群(BOW)は{車, 車内, 座席, 泊まる, 水, 自炊}となる.トピックモデルでは一般的に語順は考慮されない.この場合に生成される文書の例として「車に泊まるとき,車内で自炊ができるように水を持っていくとよいでしょう.また車内で寝られるよう座席がフルフラットにできる車を選びましょう.」があげられる.実際には「動詞」や「助詞」を表すトピックもここには入っている. トピックモデルを用いる場合,文章を生成することよりもその単語や文書がどのトピックから生成されたのかに焦点を当てることの方が多い.そのため,先ほど例に挙げた文書を解析し,トピック「自動車」や「キャンプ」などを得たり,トピック「自動車」において「車」や「座席」はどれほど影響を与えるのかなどについて分析を行う. PLSAのアルゴリズム PLSAのアルゴリズムを解説していく. 用いる記号 単語:$W = \{w_1,w_2,…,w_M\}$ 文書:$D = \{d_1,d_2,…,d_N\}$ トピック:$Z = \{z_1,z_2,…,z_K\}$ 単語と文書の同時確率 $$ \displaystyle \begin{eqnarray} P(D, W) &=& P(D)P(W|D) \\ &=&… Read More »
The post 【技術解説】確率的潜在意味解析(PLSA)のアルゴリズムと応用 appeared first on ミエルカAI は、自然言語処理技術を中心とした、RPA開発・サイト改善・流入改善レコメンドエンジンを開発.
東京大学 工学部 システム創成学科(PSI)卒業。卒業後はITベンチャー畑を 歩み、株式会社SOOL元取締役CMO/SOOL パートナー(現任)。2014年エン・ジャパン社への事業売却を行い、ミエルカの開発に参画。言語解析、クローリングなどを強みとする。
ロンドン大学(UCL)、早稲田大学大学院(化学専攻)卒業。ウェブアナリストとしてマイクロソフト、サイバーエージェント、アマゾンジャパン等で勤務。2015年、当社社外取締役CAO就任(現任)。解析ツールの導入・運用・教育、ゴール&KPI設計、施策の実施と評価、PDCAを社内で回すための取り組みなどを担当。
豊橋技術科学大学 情報・知能工学系 助教(現任)。2006年に有限会社てっくてっくを創業、2014年より現職。ウェブのコンテンツやユーザの行動に注目し、自然言語処理や計算社会科学に関する研究に従事。ウェブ・SNSの大規模なデータ収集や分析・機械学習を強みとし、人工知能学会・研究会優秀賞など数々の賞を受賞。
明治大学 理工学部 情報科学科 教授(現任) 。計算型人工知能の世界トップレベルの研究者であると同時に、マーケティングにも詳しい。近年では、言語計算、プロファイリング、ソーシャルデータ解析、推薦エンジン、データドリブンマーケティングなどの研究に従事。