図面 (/)
犯罪を予防する社会インフラ
世界中の災害や犯罪の被害は甚大である。世界の被災者数は、2011年に約2億5千万人にも及び、被害総額は年平均で2400億ドルにもなると見積もられている。また、国連薬物犯罪事務所によると、全世界で殺人…
最終更新日:2016/09/20
図面 (/)
関連する未来課題 | |||
---|---|---|---|
重要な関連分野 |
※以下の情報は公開日時点(2016年2月4日)のものです。
会計処理装置100は、ウェブサーバ110と、ウェブサーバ110とVPN技術により接続されたDB120と、DB120とVPN技術により接続されたスクレイピングサーバ130とを備える。ウェブサーバ110は、スクレイピングサーバ130により取り込んだウェブ明細データを取引ごとに識別し、各取引を、各取引の取引内容の記載に基づいて、特定の勘定科目に自動的に仕訳する。ウェブサーバ110は、この際、取引内容の記載を形態素に分節し、各形態素に対応づけられた1又は複数の勘定科目の出現頻度を参照して、取引内容の記載が表す勘定科目を推測する。作成された仕訳データは、たとえば日付、取引内容、金額及び勘定科目を少なくとも含む。
※この項目の情報は公開日時点(2016年2月4日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります
企業会計は、慣習として発達した企業会計原則に則り実施されることがルールとなっており、当該原則の一つに、損益計算書(P/L)につき「発生主義」の原則がある。発生主義(accrual basis)とは、現金の実際の収入及び支出とは関係なく、収益又は費用の事実が発生した時点で、計上しなければならないとする原則である。これは、収益及び費用を、現金の受渡しの時点で認識する現金主義(cash basis)とは反対の概念である。
各企業は、一定期間の収入及び支出を計算し、利益又は損失を算出する決算を行い、決算で作成された賃借対照表(B/S)、損益計算書(P/L)等の財務諸表を会社法の規定に基づき公告することが定められている。特に、日本では、金融商品取引法適用会社については、決算に関して時間的制約が強く、上場企業であれば四半期決算、非上場企業であっても四半期決算又は半年ごとの中間決算が求められる。諸外国においても決算の必要性は同様である。
このように、定期的な決算処理が必要であり、かつ、発生主義の原則の下で損益計算書の作成が必須であると、決算期に過大な負担がかかることを避けるために、決算期に振り返って損益計算書を作成するのではなく、日々の業務の中で生じる収益及び費用を、常に、発生主義の原則に沿って言わばデイリーベースで処理していくことが必要となり、実務上もそのように処理がなされている。
たとえば、大企業においては、会計処理のための社内システムがあり、発生した取引を勘定科目に仕訳して仕訳データとして登録する作業を、各部門の担当者が日常の業務として行っている。このように仕訳した仕訳データを蓄積していき仕訳帳データ及び総勘定元帳データを作成することによって、各決算期にスピーディーな財務諸表(決算書)の作成が可能となっている。作成された総勘定元帳データから賃借対照表、損益計算書等の財務諸表の作成については、市販の会計ソフトが用いられる場合が多い。
中小企業及び個人事業主等、発生主義の原則に従うべき時期的制約が緩やかな事業者に対し、簡便かつ安価な会計処理装置、会計処理方法及び会計処理プログラムを提供する。会計処理装置100は、ウェブサーバ110と、ウェブサーバ110とVPN技術により接続されたDB120と、DB120とVPN技術により接続されたスクレイピングサーバ130とを備える。ウェブサーバ110は、スクレイピングサーバ130により取り込んだウェブ明細データを取引ごとに識別し、各取引を、各取引の取引内容の記載に基づいて、特定の勘定科目に自動的に仕訳する。ウェブサーバ110は、この際、取引内容の記載を形態素に分節し、各形態素に対応づけられた1又は複数の勘定科目の出現頻度を参照して、取引内容の記載が表す勘定科目を推測する。作成された仕訳データは、たとえば日付、取引内容、金額及び勘定科目を少なくとも含む。
本発明は、このような問題点に鑑みてなされたものであり、その目的は、中小企業、個人事業主等、発生主義の原則に従うべき時期的制約が緩やかである事業者に対し、簡便かつ安価な会計処理装置、会計処理方法及び会計処理プログラムを提供する
※以下の情報は公開日時点(2016年2月4日)のものです。
クラウドコンピューティングによる会計処理を行うための会計処理装置であって、ユーザーにクラウドコンピューティングを提供するウェブサーバを備え、前記ウェブサーバは、ウェブ明細データを取引ごとに識別し、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳し、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成し、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする会計処理装置。
前記仕訳は、勘定科目ごとに、各キーワードが有する出現頻度をスコアとして合計して、最も高いスコアの勘定科目に自動的に仕訳をすることを特徴とする請求項1又は2に記載の会計処理装置。
前記仕訳処理画面は、勘定科目を変更するためのメニューを有することを特徴とする請求項1から4のいずれかに記載の会計処理装置。
ユーザーが、自動的に仕訳された勘定科目を前記メニューから選択して修正した場合に、取引内容の記載と修正された勘定科目との対応づけを、ユーザーごとのユーザールールとして、前記会計処理装置の記憶部に格納することを特徴とする請求項5に記載の会計処理装置。
前記出現頻度は、前記記憶部に格納された、複数のユーザーのユーザールールに基づいて定められることを特徴とする請求項6に記載の会計処理装置。
前記出現頻度は、各ユーザールールに含まれる取引内容の記載をキーワードに分節し、各キーワードにつき、修正された勘定科目の出現回数のカウントをインクリメントして定められることを特徴とする請求項7に記載の会計処理装置。
前記キーワードは、形態素であることを特徴とする請求項1から8のいずれかに記載の会計処理装置。
形態素への分節は、ドメイン処理を要することなく行われることを特徴とする請求項9に記載の会計処理装置。
ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理方法であって、前記ウェブサーバが、ウェブ明細データを取引ごとに識別するステップと、前記ウェブサーバが、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳するステップと、前記ウェブサーバが、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成するステップとを含み、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする会計処理方法。
ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理プログラムであって、前記ウェブサーバに、ウェブ明細データを取引ごとに識別するステップと、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳するステップと、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成するステップとを含み、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする方法を実行させるための会計処理プログラム。
※以下の情報は 公開日時点 (2016年2月4日)のものです。
0001
本発明は、会計処理装置(accounting apparatus)、会計処理方法及び会計処理プログラムに関し、より詳細には、クラウドコンピューティングによる会計処理を行うための会計処理装置、会計処理方法及び会計処理プログラムに関する。
0002
企業会計は、慣習として発達した企業会計原則に則り実施されることがルールとなっており、当該原則の一つに、損益計算書(P/L)につき「発生主義」の原則がある。発生主義(accrual basis)とは、現金の実際の収入及び支出とは関係なく、収益又は費用の事実が発生した時点で、計上しなければならないとする原則である。これは、収益及び費用を、現金の受渡しの時点で認識する現金主義(cash basis)とは反対の概念である。
0003
各企業は、一定期間の収入及び支出を計算し、利益又は損失を算出する決算を行い、決算で作成された賃借対照表(B/S)、損益計算書(P/L)等の財務諸表を会社法の規定に基づき公告することが定められている。特に、日本では、金融商品取引法適用会社については、決算に関して時間的制約が強く、上場企業であれば四半期決算、非上場企業であっても四半期決算又は半年ごとの中間決算が求められる。諸外国においても決算の必要性は同様である。
0004
このように、定期的な決算処理が必要であり、かつ、発生主義の原則の下で損益計算書の作成が必須であると、決算期に過大な負担がかかることを避けるために、決算期に振り返って損益計算書を作成するのではなく、日々の業務の中で生じる収益及び費用を、常に、発生主義の原則に沿って言わばデイリーベースで処理していくことが必要となり、実務上もそのように処理がなされている。
0005
たとえば、大企業においては、会計処理のための社内システムがあり、発生した取引を勘定科目に仕訳して仕訳データとして登録する作業を、各部門の担当者が日常の業務として行っている。このように仕訳した仕訳データを蓄積していき仕訳帳データ及び総勘定元帳データを作成することによって、各決算期にスピーディーな財務諸表(決算書)の作成が可能となっている。作成された総勘定元帳データから賃借対照表、損益計算書等の財務諸表の作成については、市販の会計ソフトが用いられる場合が多い。
0007
すなわち、会計処理を要する企業のすべてに対して、発生主義の原則に沿った会計処理をデイリーベースで行うスピード感が求められるわけではないのである。出願人は、大企業ではなく、中小企業、個人事業主等に焦点を当てると、市販の会計ソフトは、その実情に合った機能を提供し得ていないことを見出した。日本を含め、中小企業、個人事業主等に求められる決算は年に一度だけというのが一般的であり、この決算時には法の定めに従い遅滞なく公告を行う必要があるものの、年に一度の決算時に発生主義の原則に沿った仕訳帳データ及び総勘定元帳データが得られれば足りるのであって、デイリーベースの仕訳処理は不要といってよい。
0008
本発明は、このような問題点に鑑みてなされたものであり、その目的は、中小企業、個人事業主等、発生主義の原則に従うべき時期的制約が緩やかである事業者に対し、簡便かつ安価な会計処理装置、会計処理方法及び会計処理プログラムを提供することにある。
0009
このような目的を達成するために、本発明の第1の態様は、クラウドコンピューティングによる会計処理を行うための会計処理装置であって、ユーザーにクラウドコンピューティングを提供するウェブサーバを備え、前記ウェブサーバは、ウェブ明細データを取引ごとに識別し、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳し、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成し、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする。
0010
本発明の第2の態様は、第1の態様において、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度は、キーワードごとに正規化されていることを特徴とする。
0011
本発明の第3の態様は、第1又は第2の態様において、前記仕訳は、勘定科目ごとに、各キーワードが有する出現頻度をスコアとして合計して、最も高いスコアの勘定科目に自動的に仕訳をすることを特徴とする。
0012
本発明の第4の態様は、第1から第3のいずれかの態様において、一文字の記号又は数字のみのキーワードは、前記スコアの合計において考慮しないことを特徴とする。
0013
本発明の第5の態様は、第1から第4のいずれかの態様において、前記仕訳処理画面は、勘定科目を変更するためのメニューを有することを特徴とする。
0014
本発明の第6の態様は、第5の態様において、ユーザーが、自動的に仕訳された勘定科目を前記メニューから選択して修正した場合に、取引内容の記載と修正された勘定科目との対応づけを、ユーザーごとのユーザールールとして、前記会計処理装置の記憶部に格納することを特徴とする。
0015
本発明の第7の態様は、第6の態様において、前記出現頻度は、前記記憶部に格納された、複数のユーザーのユーザールールに基づいて定められることを特徴とする。
0016
本発明の第8の態様は、第7の態様において、前記出現頻度は、各ユーザールールに含まれる取引内容の記載をキーワードに分節し、各キーワードにつき、修正された勘定科目の出現回数のカウントをインクリメントして定められることを特徴とする。
0017
本発明の第9の態様は、第1から第8のいずれかの態様において、前記キーワードは、形態素であることを特徴とする。
0018
本発明の第10の態様は、第9の態様において、形態素への分節は、ドメイン処理を要することなく行われることを特徴とする。
0019
本発明の第11の態様は、ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理方法であって、前記ウェブサーバが、ウェブ明細データを取引ごとに識別するステップと、前記ウェブサーバが、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳するステップと、前記ウェブサーバが、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成するステップとを含み、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする。
0020
本発明の第12の態様は、ウェブサーバが提供するクラウドコンピューティングによる会計処理を行うための会計処理プログラムであって、前記ウェブサーバに、ウェブ明細データを取引ごとに識別するステップと、各取引を、前記各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳するステップと、日付、取引内容、金額及び勘定科目を少なくとも含む仕訳データを作成するステップとを含み、作成された前記仕訳データは、ユーザーが前記ウェブサーバにアクセスするコンピュータに送信され、前記コンピュータのウェブブラウザに、仕訳処理画面として表示されることを特徴とする方法を実行させるための会計処理プログラムである。
0021
本発明によれば、ウェブ明細データから識別された各取引を、当該各取引の取引内容の記載をキーワードに分節し、各キーワードに対応づけられた1又は複数の勘定科目の出現頻度を参照して、特定の勘定科目に自動的に仕訳することにより、発生主義の原則に従うべき時期的制約が緩やかである事業者に対し、簡便かつ安価な会計処理装置、会計処理方法及び会計処理プログラムを提供することができる。
0022
本発明の一実施形態に係る会計処理装置を示す図である。
本発明の一実施形態に係る仕訳処理画面を示す図である。
自動的に分類された勘定科目の修正時の仕訳処理画面を示す図である。
作成された仕訳データの一覧を示す図である。
0023
以下、図面を参照して本発明の実施形態を詳細に説明する。
0025
図1に、本発明の一実施形態に係る会計処理装置を示す。会計処理装置100は、ユーザーにクラウドコンピューティングを提供するウェブサーバ110と、ウェブサーバ110と仮想プライベートネットワーク(VPN)技術により接続されたデータベース120と、データベース120とVPN技術により接続されたスクレイピングサーバ130とを備える。
0026
ユーザーは、PC、スマートフォン、タブレット等のコンピュータ140のウェブブラウザを用いて、ウェブサーバ110のURLにアクセスする。ウェブサーバ110は、取り込んだウェブ明細データを取引ごとに識別し、各取引を、各取引の取引内容の記載(description)に基づいて、特定の勘定科目に自動的に仕訳する。金額が正のときは収入、負のときは支出といった仕訳が可能である。ウェブサーバ110は、この際、取引内容の記載を形態素(morpheme)に分節し、各形態素に対応づけられた1又は複数の勘定科目の出現頻度(occurence rate)を参照して、取引内容の記載が表す勘定科目を推測する。作成された仕訳データは、たとえば日付、取引内容、金額及び勘定科目を少なくとも含み、こうした仕訳データの蓄積が仕訳帳データとなる。
0027
なお、ここで「形態素」とは、意味を持つ最小の言語単位をいい、以下、当該用語をもって説明を行うが、本発明においては、必ずしも最小の言語単位ではなく、より広い言語単位のキーワードへの分節を行ってもよい。
0028
出現頻度及び仕訳データは、ウェブサーバ110に格納してもよいが、データベース120に格納してもよい。
0029
ウェブサーバ110は、作成した仕訳データを含むHTMLプログラムをコンピュータ140に送信し、これは、コンピュータ140のウェブブラウザによって仕訳処理画面として表示され、ユーザーに提示される。本発明の各機能は、Ruby及びMySQLによって実装することができ、一部をHTML中のJavaScript(登録商標)によって実装することができる(たとえば、後述する図3のコンボボックス301)。つまり、ウェブサーバ110は、Ruby等の言語で記述されたプログラムを実行することにより、各機能を実行する手段として動作し、単一のサーバであっても複数のサーバにより構成されていてもよい。
0030
図2に、本発明の一実施形態に係る仕訳処理画面を示す。取り込んだウェブ明細データを取引ごとに識別し、各取引につき、日付欄201(「2014/6/22」)、金額欄202(「-1,530」)、取引内容を示す概要欄203(「ジーユー(登録商標)」)、勘定科目欄204(「消耗品費」)、勘定科目とは別個の区分を設ける摘要タグ欄(図示せず)等が表示されている。
0031
ウェブ明細データの取り込みは、ユーザーがCSV等の形式のファイルを自らアップロードすることも可能であるが、本発明の一実施形態では、インターネット上から自動的に取得するウェブ明細データ取得部をさらに設けることができる。具体的には、データベース120とVPN技術により接続されたスクレイピングサーバ130を配置し、ユーザーが登録し、ウェブサーバ110ないしデータベース120に格納された口座番号及びパスワードを読み出して、ウェブスクレイピングによって、金融機関151、クレジットカード会社152、決済業者(例:電子マネーSuica(登録商標))(図示せず)等から各種のウェブ明細データを取得することができる。取得されたウェブ明細データは、ウェブサーバ110ないしデータベース120に格納され、仕訳処理の際に読み出される。
0032
また、ウェブスクレイピングではなく、領収書等をカメラで撮影してウェブサーバ110に送信することによって、ウェブ明細データを取得してもよい。この際、スマートフォン、タブレット等の携帯端末用のアプリとして実装すれば、領収書等をアプリに読み込むと、自動的にユーザーのアカウントに取り込まれるようにすることができる。アプリ開発を促すために、ウェブ明細データを取り込むためのAPIを提供することもできる。また、領収書等の電子データを電子メールで受信する場合があるが、この場合に、受信アドレスにユーザーのアカウントと関連づけられたアカウントが含まれるようにすれば、領収書等の電子データを解析してウェブ明細データとして取り込むこともできる。電子データとしては、PDF、画像ファイル、テキストファイル等が挙げられる。また、ウェブサーバ110が受信するのではなく、メールサーバ(図示せず)で受信・解析を行い、得られたウェブ明細データをウェブサーバ110に送信してもよい。また、領収書の他、請求書をカメラで撮影してウェブサーバ110に送信することによって、負債が発生したことの記録も可能である。たとえば、請求書を受け取った時点で、それをカメラ撮影及びOCRにより電子化し、負債として仕訳して登録しておくことで、実際に支払を行わなければならないことのリマインダーとなるし、実際に支払を行ったときには、どの支払予定に対して支払を行ったのかを銀行明細と支払予定との間でマッチングを行うことで管理することができる。このような支払予定(買掛金、未払金等)の消し込みを簡単に行うことや、発生主義にも対応することへのニーズもあり、領収書の画像取り込みも有益な機能である。加えて、このような領収書、請求書等の画像取り込みは、それぞれの仕訳への画像データの紐付けを可能とし、証憑管理を容易にする。また、領収書等の一般的な会計書類のほか、たとえば、電子メールに記載された会計データ、SNS上の投稿に記載された会計データ等、インターネット上でユーザーと関連づけられた会計データを分析して当該ユーザーのアカウントに取り込まれるようにしてもよい。このようにすることで、現金により支払をした際等に支出の管理が容易になる。
0033
多くの場合、複数の金融機関、クレジットカード会社、決済業者等が提供する複数の種類のウェブ明細データがウェブサーバ110に取り込まれ、その種類ごとに取引処理画面200に表示してもよいし、図2に示すように日付の順に表示してもよい。
0034
また、図2では、各取引につき、表示された内容をユーザーが確認して「登録」ボタンを押下することで、仕訳データが作成され、記憶されるように示されているが、「登録」ボタンの押下を不要にして、ウェブサーバ110が自動的に作成した仕訳データをそのまま記憶し、取引処理画面200では、必要な修正のみを行うようにしてもよい。
0035
図3に、自動的に分類された勘定科目の修正時の仕訳処理画面を示す。勘定科目欄204がクリックされると、仕訳処理画面200は、他の選択肢を示すプルダウンメニュー等のコンボボックス301を表示する。各選択肢には、ヘルプ302を付けることで経理の知識がなくてもカンタンに適切な勘定科目を選択することができる。コンボボックス301を、図示したような、入れ子式のインタラクティブなもの、すなわちユーザーの選択に応じて更に下位の選択肢が示されるものにすると、ユーザーを感覚的にナビゲートして適切な勘定科目に辿り着かせることができる。
0036
修正した結果は、ユーザーごとのユーザールールとしてウェブサーバ110ないしデータベース120に保存され、次回からは、その取引内容に対して修正された勘定科目を表示するようにすることができる。このようにして蓄積された修正結果は、後述するように、各形態素に対応づけられた1又は複数の勘定科目の出現頻度の機械学習による学習済み(ラーンド)データベース(learned DB)の生成に用いられ、これはスタンドアロンアプリケーションではなく、クラウド技術であるからこそ可能となるものである。
0037
摘要タグ欄等についても、勘定科目と同様に自動的に摘要タグを割り当てて表示することが可能であり、その場合には、勘定科目欄204と同様にプルダウンメニュー等のコンボボックスの表示、修正結果の保存・利用を行うことができる。
0039
(仕訳処理の詳細)
本発明において、取引内容の記載が表す勘定科目の推測・推論(inference)は、取引内容の記載を形態素に分節し、各形態素に対応づけられた1又は複数の勘定科目の出現頻度を参照して、当該取引内容の記載が表す勘定科目を推測する。
0040
ここで、取引内容の記載が「損害保険ジャパン(登録商標)保険料(インターネット)」の場合を例を考える。この記載を形態素に分かち書きすると、「損害」、「保険」、「ジャパン」、「保険料」、「インターネット」の5つに分節される。ウェブサーバ110は、各形態素につき、ラーンド・データベースから、当該形態素に対応づけられた1又は複数の勘定科目の出現頻度を読み出す。各形態素が有する出現頻度は、たとえば以下のようになる。簡単のため、出現確率が0.01未満のものについては省略している。
0041
0042
上記例では、各形態素が有する出現頻度は、合計が1.0となるように正規化された出現確率になっている。正規化を行うと、精度向上を図ることができる。たとえば概要欄203に「○×薬局神田駅東口店」との記載が現れた場合、正規化せずに出現回数を足し合わせると、「○×」や「薬局」よりも「駅」の方がウェブ明細データに含まれる回数が圧倒的に多いため、形態素「駅」から推測される勘定科目である「旅費交通費」が割り当てられることになる。ウェブ明細データに含まれる回数が多い形態素に推測結果が引っ張られてしまうのである。他方、正規化を行うと、形態素「薬局」の有する出現確率は勘定科目「消耗品費」が形態素「駅」による勘定科目「旅費交通費」よりも高い値を示し、「薬局」がウェブ明細データに含まれる回数が「駅」よりは少なくとも、正しく「消耗品費」を推論することができる。
0043
ウェブサーバ110は、一態様において、各形態素が有する出現確率を、勘定科目ごとにスコアとして合計する。計算の結果、最も高いスコアの勘定科目を推測結果として割り当てる。上記例では、「ジャパン」は「仕入高」の勘定科目、「インターネット」は「通信費」の勘定科目を最も推測させるが、合計スコアからは「保険料」最も高いスコアの勘定科目であり、これが割り当てられることとなる。
0044
本発明では、未知の取引内容の記載についても、自動的な仕訳をすることができる。取引内容の記載に含まれる各形態素についての予め生成された出現頻度を用いて、初めて処理を行う場合であっても、最も確からしい勘定科目に分類することができる。たとえば、「XYZ損保」という新たな損害保険会社が設立され、これが取引内容の記載に初めて現れた場合、ウェブサーバ110は、これを処理したことがない。しかしながら、ウェブサーバ110は、「XYZ」及び「損保」に分節し、たとえば、「XYZ」についてはラーンド・データベースに出現頻度の登録がなく、「損保」については以下の登録がある場合、推測結果として「保険料」を割り当てることができる。左側が勘定科目、右側が正規化された出現頻度、すなわち出現確率である。
0045
0046
本発明では、取引相手を取引内容の記載から特定して、その上で仕訳を行うのではなく、取引内容の記載が表す勘定科目を推測するために必要な限りにおいて情報を抽出すれば足りることに着目している。新会社の設立や、既存の会社の社名変更等への対応は、勘定科目の自動仕訳においてデータベースの定期的メンテナンスを要求するおそれがあるが、本発明では、勘定科目を説明することのできる形態素が取引内容の記載に含まれていれば確からしい勘定科目への分類が可能である。
0047
このことは、取引内容の記載がカード会社、決済会社等によって揺らぎがあるという表記ゆれの問題に対して同様である。たとえば、セブンイレブンという事業者は、「セブンイレブン」、「セブン−イレブン」、「セブン—イレブン」等のように、ウェブ明細データ上、一定の表記が必ずしも用いられない。このような場合に、本発明では、いずれの表記についても、同様に「雑費」の勘定科目を推測することができる。たとえば、「セブン−イレブン」の表記が取引内容の記載に現れたとしても、これは「セブン」と「イレブン」に分節され、各形態素につき、以下のような出現頻度がラーンド・データベースから取得される。なお、出現確率が0.05未満のものについては省略している。
0048
0049
各形態素が有する出現確率をスコアとして合計すると、勘定科目「雑費」について0.63509というスコアが最も高い値となり、これが推測結果として割り当てられる。この結果は、表記が「セブンイレブン」であっても「セブン−イレブン」であっても同一であり、表記ゆれを補正するための名寄せや、多様な表記に対応するためのドメイン処理が施された特殊な形態素解析用辞書(たとえば、IPA辞書以外のもの)が不要である。このことは、取引内容の記載が表す勘定科目を推測するためには、取引相手自体の特定ではなく、各形態素の説明力を分析することが極めて効率的であることを示している。
0050
また、「セブン−イレブン」のハイフン、「水道料4月分」の4などは、複数の勘定科目に出現確率が薄く存在し、いずれの勘定科目にもスパイクが出ないため、スコア計算にあたり考慮せずに除去してもよい。これにより、計算効率向上を図ることができる。
0051
(ラーンド・データベースの詳細)
形態素「インターネット」を例として、ラーンド・データベースの生成につき説明する。
0052
ユーザーが、ウェブブラウザ上の仕訳処理画面において、勘定科目を変更するためのメニュー301により、推測結果を修正すると、取引内容の記載と修正された勘定科目との対応づけが、ユーザーごとのユーザールールとして、会計処理装置100の記憶部に格納される。
0053
そして、一態様においては、各ユーザールールに含まれる取引内容の記載をキーワードに分節し、各キーワードにつき、修正された勘定科目の出現回数のカウントをインクリメントすることにより、出現頻度を、複数のユーザーのユーザールールに基づいて定めることができる。
0054
下記表には、複数のユーザーによる修正結果を示している。
0055
0056
上記修正結果において、各取引内容の記載を形態素解析し、各形態素の出現頻度を算出すると以下のようになる。出現確率については、各形態素につき、下記表に挙げられている勘定科目のみが、各形態素に対応づけられているものとして、正規化を行っている。
0057
0059
ラーンド・データベースの生成に用いられるユーザールールは、現在使用されているユーザールールとしてもよいし、ログを含めてもよいし、ログのみとしてもよい。集合知(collective intelligence)を用いることにより、データベースの構築・メンテナンスの負担を軽減することができる。現在使用されているユーザールールのみに基づいてラーンド・データベースを構成すると、周囲のユーザーがどのようなマッチングを行っているかをリアルタイムで反映して推測結果を提示することができる。
0060
リアルタイムで反映することの1つのメリットとして、一度、あるユーザーが仕訳を行えば、まったく新しい取引についても、全ユーザーに対して更新された推論アルゴリズムが適用されることになり汎用性があり、運営上はメンテナンスが不要となり、ユーザーエキスペリエンスとしては自動仕訳精度の向上を図ることができる。
0061
また、ラーンド・データベースの精度向上のために、ユーザーのセグメント化を行うこともできる。業種、個人・法人の違い等により、セグメント化することにより、同一のキーワードをセグメントに応じて適切に仕訳することができる。たとえば、「○×問屋」との記載が概要欄203に現れた場合、小売業等の法人では「仕入」に該当し、個人事業主では「消耗品」に該当するといったケースが考えられる。また、金額欄202に応じたセグメント化も考えられる。たとえば、10万円未満の「ヨドバシカメラ」は「消耗品」と、10万円以上は「固定資産」にするといったことが考えられる。
0062
100会計処理装置
110ウェブサーバ
120データベース
130スクレイピングサーバ
140コンピュータ
151金融機関
152クレジットカード会社
200取引処理画面
201日付欄
202金額欄
203概要欄
204勘定科目欄
301コンボボックス
302 ヘルプ
【課題】レシートの出力を柔軟に行うことが可能な印字制御装置及びプログラムを提供する。【解決手段】取引毎に当該取引の内容を示したレシート情報を生成する生成手段と、前記レシート情報を用紙に印字出力する印字 ... 詳細
【課題】複数施設における点検項目の設定や管理における管理者の負担を軽減する点検管理システムを提供する。【解決手段】点検管理サーバ装置と、管理者が利用する一つ又は複数の管理者端末装置と、点検者が利用する ... 詳細
【課題】捜索対象の関連情報に対する閲覧アクセスを抑制しつつ、捜索対象の発見につながる問合せ画像を有効に収集してその画像照合を行うこと。【解決手段】画像照合システムおよび画像照合装置10は、捜索事象に係 ... 詳細
本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。
特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ