機械学習でスタートアップするなら、データベースを売るべき

昨年の後半、実は機械学習に興味を持ってビジネスに使えないかといろいろ 試したのですが、結局ダメでした。
最近改めて振り返って、機械学習はどうあるべきか考えたのでその思考メモです。

まず、機械学習を成り立たせるために最低限必要な準備は以下の3つです。
・ある程度似たようなフォーマットの膨大な母数のデータ
・データの明確な分類の定義
・形態素解析等の言語処理技術
これらをまず揃えればとりあえずそれっぽいことはできるかと。

これを、例えば〜〜に関してユーザーの好みを覚えるサービス!と言ったところでかなり無理があります。なぜなら、一人一人のユーザーの好みに関して事前に膨大なデータを用意するのは不可能に近いからです。

僕の考えとしては、まずユーザーの好みを覚えてレコメンド!とかは機械学習でやるにはまだ早いです。
それより、例えばgoogleのスパム検知システムをAPI化してお金を払えば誰でも使える、みたいな、一歩進んだデータベースとして販売するのが良いかと思います。

これは、インターネット上に構築された集合知を、経験知として昇華させるような感じで、世界全体の効率を劇的に高めるでしょう。

もう少し具体的な案がでてきたらなんかやりたいなー

あーなんか自分で書いてて違う気がしてきた…