<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>WordPress Related Post for Japanese 1.01 (バグフィックスリリース) へのコメント</title>
	<atom:link href="http://another.maple4ever.net/archives/399/feed/" rel="self" type="application/rss+xml" />
	<link>http://another.maple4ever.net/archives/399/</link>
	<description>have a lot of interests.</description>
	<lastBuildDate>Wed, 10 Mar 2010 15:10:32 +0000</lastBuildDate>
	
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>独断と偏見の何でもレビュー より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3368</link>
		<dc:creator>独断と偏見の何でもレビュー</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3368</guid>
		<description>&lt;strong&gt;マルコフ連鎖による自動文章生成...&lt;/strong&gt;

hiromasaさんが作成した WordPress プラグイン WordPress Related Post for Japanese が生成する形態素解析の結果を利用して、マルコフ連鎖による自動文章生成をやってみました。
「Yahoo!のAPIを利用して...</description>
		<content:encoded><![CDATA[<p><strong>マルコフ連鎖による自動文章生成&#8230;</strong></p>
<p>hiromasaさんが作成した WordPress プラグイン WordPress Related Post for Japanese が生成する形態素解析の結果を利用して、マルコフ連鎖による自動文章生成をやってみました。<br />
「Yahoo!のAPIを利用して&#8230;
<div class="comment-next"><a href="http://dogmap.jp/2008/08/27/markov-text-generator/">[続きを読む]</a></div>
]]></content:encoded>
	</item>
	<item>
		<title>をかもと より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3360</link>
		<dc:creator>をかもと</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3360</guid>
		<description>ひろまささん、どもです。

エントリ中にショートコードが埋め込まれてると上手くないです。
頻出単語の中にショートコード名やプロパティ名が入ってしまって、関連が無い記事もピックアップされてしまいます。
WordPress 2.6 からは、メディアライブラリに登録された画像をエントリに挿入すると、デフォルトで caption と言うショートコードが挿入されるので、かなり致命的では？

辞書作成時、Yahoo の 日本語形態素解析API に渡す前に strip_tags() しているのであれば、ショートコードタグも剥ぎ取ってはいかがでしょうか？
# とりあえず preg_replace(&#039;/\[[^\]]*\]/&#039;, &#039;&#039;, $content) で行けるはず。</description>
		<content:encoded><![CDATA[<p>ひろまささん、どもです。</p>
<p>エントリ中にショートコードが埋め込まれてると上手くないです。<br />
頻出単語の中にショートコード名やプロパティ名が入ってしまって、関連が無い記事もピックアップされてしまいます。<br />
WordPress 2.6 からは、メディアライブラリに登録された画像をエントリに挿入すると、デフォルトで caption と言うショートコードが挿入されるので、かなり致命的では？</p>
<p>辞書作成時、Yahoo の 日本語形態素解析API に渡す前に strip_tags() しているのであれば、ショートコードタグも剥ぎ取ってはいかがでしょうか？<br />
# とりあえず preg_replace(&#8216;/\[[^\]]*\]/&#8217;, &#8221;, $content) で行けるはず。</p>
]]></content:encoded>
	</item>
	<item>
		<title>Wing World&#187; ブログアーカイブ &#187; iWPhone WordPress Plugin and Theme Version 0.1.2 より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3349</link>
		<dc:creator>Wing World&#187; ブログアーカイブ &#187; iWPhone WordPress Plugin and Theme Version 0.1.2</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3349</guid>
		<description>[...] シンプルにまとめられていて、これならiPhoneやiPod touchでもかなり見やすい感じですね。ちなみに2枚目の「このブログで関連すると思われる他の投稿」というのは、WordPress Related Post for Japaneseというプラグインで、Yahoo! Japan が提供する日本語形態素解析APIという機能を利用して抽出しているそうです。さらにその下の「はてなブックマーク」の部分もHatena bookmark anywhereというプラグインです。詳しくは、WordPress Plugins/JSeriesのWordPress Related Post for JapaneseとHatena bookmark anywhereのところをご覧ください。 [...]</description>
		<content:encoded><![CDATA[<p>[...] シンプルにまとめられていて、これならiPhoneやiPod touchでもかなり見やすい感じですね。ちなみに2枚目の「このブログで関連すると思われる他の投稿」というのは、WordPress Related Post for Japaneseというプラグインで、Yahoo! Japan が提供する日本語形態素解析APIという機能を利用して抽出しているそうです。さらにその下の「はてなブックマーク」の部分もHatena bookmark anywhereというプラグインです。詳しくは、WordPress Plugins/JSeriesのWordPress Related Post for JapaneseとHatena bookmark anywhereのところをご覧ください。 [...]
<div class="comment-next"><a href="http://rikanet.com/2008/08/23/iwphone-wordpress-plugin-and-theme-version-012/">[続きを読む]</a></div>
]]></content:encoded>
	</item>
	<item>
		<title>yuriko より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3304</link>
		<dc:creator>yuriko</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3304</guid>
		<description>&lt;blockquote&gt;これを利用すれば、圧縮新聞の WordPress プラグイン版とか、すぐできそうな気がします。&lt;/blockquote&gt;

自動要約はなかなか難しいですよ。形態素解析だけでやるとすれば、冗長な単語 (「えーと」とか) を除去するぐらいでしょうか。接続詞から文同士の関係を見て、より重要な文を残すなどの処理になると、あらゆる接続詞についてルールを書かないといけないのでちょっと作業が多くなります。
ただし、XHTML ドキュメントだと、ul とか dl とかの箇条書き系や blockquote など引用系は重要度が低いと判断するなどのヒューリスティックは使えるかもしれません。

新聞の場合、冒頭にある文章を抜き出して冗長な語句を抜けばいいので実は楽なんです。ブログのような雑文だと、どこに論旨があるか不明なので、要約がやりにくい題材ですね。</description>
		<content:encoded><![CDATA[<blockquote><p>これを利用すれば、圧縮新聞の WordPress プラグイン版とか、すぐできそうな気がします。</p></blockquote>
<p>自動要約はなかなか難しいですよ。形態素解析だけでやるとすれば、冗長な単語 (「えーと」とか) を除去するぐらいでしょうか。接続詞から文同士の関係を見て、より重要な文を残すなどの処理になると、あらゆる接続詞についてルールを書かないといけないのでちょっと作業が多くなります。<br />
ただし、XHTML ドキュメントだと、ul とか dl とかの箇条書き系や blockquote など引用系は重要度が低いと判断するなどのヒューリスティックは使えるかもしれません。</p>
<p>新聞の場合、冒頭にある文章を抜き出して冗長な語句を抜けばいいので実は楽なんです。ブログのような雑文だと、どこに論旨があるか不明なので、要約がやりにくい題材ですね。</p>
]]></content:encoded>
	</item>
	<item>
		<title>ひろまさ より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3303</link>
		<dc:creator>ひろまさ</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3303</guid>
		<description>おお、よかったす!
ゲーム系の投稿でちゃんとゲーム関連がでていて、思わず Wikipedia のようにあちこちさまよってしまいました :-)

圧縮WordPress いいっすね。 うちの抜粋 RSS、これにしますか（笑）</description>
		<content:encoded><![CDATA[<p>おお、よかったす!<br />
ゲーム系の投稿でちゃんとゲーム関連がでていて、思わず Wikipedia のようにあちこちさまよってしまいました <img src='http://another.maple4ever.net/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
<p>圧縮WordPress いいっすね。 うちの抜粋 RSS、これにしますか（笑）</p>
]]></content:encoded>
	</item>
	<item>
		<title>をかもと より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3300</link>
		<dc:creator>をかもと</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3300</guid>
		<description>MySQL4系でもバッチリ動作しました。
ただいま辞書構築中。

この形態素解析後のデータは良いですね。
これを利用すれば、&lt;a href=&quot;http://pha22.net/comp/&quot; title=&quot;圧縮新聞&quot; rel=&quot;nofollow&quot;&gt;圧縮新聞&lt;/a&gt;の WordPress プラグイン版とか、すぐできそうな気がします。</description>
		<content:encoded><![CDATA[<p>MySQL4系でもバッチリ動作しました。<br />
ただいま辞書構築中。</p>
<p>この形態素解析後のデータは良いですね。<br />
これを利用すれば、<a href="http://pha22.net/comp/" title="圧縮新聞" rel="nofollow">圧縮新聞</a>の WordPress プラグイン版とか、すぐできそうな気がします。</p>
]]></content:encoded>
	</item>
	<item>
		<title>ひろまさ より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3299</link>
		<dc:creator>ひろまさ</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3299</guid>
		<description>そーなんですよね。　このデータはいろいろ使えそうなので、とれるだけとってみました。　実は使うのは出現頻度情報データだけでよかったのですが、形態素解析の生も別途とってきていたりします。(笑)

いずれにせよこの手の解析は興味がありますので、なにか面白いものができることを期待しています。 :-)</description>
		<content:encoded><![CDATA[<p>そーなんですよね。　このデータはいろいろ使えそうなので、とれるだけとってみました。　実は使うのは出現頻度情報データだけでよかったのですが、形態素解析の生も別途とってきていたりします。(笑)</p>
<p>いずれにせよこの手の解析は興味がありますので、なにか面白いものができることを期待しています。 <img src='http://another.maple4ever.net/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>yuriko より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3298</link>
		<dc:creator>yuriko</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3298</guid>
		<description>＞N-Gram 楽しみです。実はつくるのを一度断念していまして。

関連投稿を出すのはあまり興味がないので、なかなか着手しないかもしれません。

実は来年のエイプリルフールプラグインは形態素解析系を検討していて、Yahoo! API をそろそろ勉強する予定でした。しかし、「ジョークプラグインのために Yahoo! に登録してもらう」のはなかなか敷居が高いと思っていたところです。
本プラグインが普及すれば、RAW XML を横取りするだけで「ジョークプラグイン」が実現できるので、楽になりそうです ;-)</description>
		<content:encoded><![CDATA[<p>＞N-Gram 楽しみです。実はつくるのを一度断念していまして。</p>
<p>関連投稿を出すのはあまり興味がないので、なかなか着手しないかもしれません。</p>
<p>実は来年のエイプリルフールプラグインは形態素解析系を検討していて、Yahoo! API をそろそろ勉強する予定でした。しかし、「ジョークプラグインのために Yahoo! に登録してもらう」のはなかなか敷居が高いと思っていたところです。<br />
本プラグインが普及すれば、RAW XML を横取りするだけで「ジョークプラグイン」が実現できるので、楽になりそうです <img src='http://another.maple4ever.net/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>ひろまさ より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3296</link>
		<dc:creator>ひろまさ</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3296</guid>
		<description>yuriko さん

なるほど、ストップワードというのですね。たしかに、開発中も試験データで「ぼく」などが上位にでてきていて気になっていました。　オプション画面にストップワード設定があると良い感じがしますね。　うーん、参考になります。

一応、容量を犠牲にして RAW XML も保持していますので少し研究してみることにします。　これはおもしろいですね!

N-Gram 楽しみです。実はつくるのを一度断念していまして。。　hiromasa.zone.ne.jp が 8M リミットのメモリだったのもあるのですが、アルゴリズム的にも分からないことがたくさんあったので、とても勉強になりそうです。 :-)</description>
		<content:encoded><![CDATA[<p>yuriko さん</p>
<p>なるほど、ストップワードというのですね。たしかに、開発中も試験データで「ぼく」などが上位にでてきていて気になっていました。　オプション画面にストップワード設定があると良い感じがしますね。　うーん、参考になります。</p>
<p>一応、容量を犠牲にして RAW XML も保持していますので少し研究してみることにします。　これはおもしろいですね!</p>
<p>N-Gram 楽しみです。実はつくるのを一度断念していまして。。　hiromasa.zone.ne.jp が 8M リミットのメモリだったのもあるのですが、アルゴリズム的にも分からないことがたくさんあったので、とても勉強になりそうです。 <img src='http://another.maple4ever.net/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>kuniharumaki blog より</title>
		<link>http://another.maple4ever.net/archives/399/comment-page-1/#comment-3294</link>
		<dc:creator>kuniharumaki blog</dc:creator>
		<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate>
		<guid isPermaLink="false">http://another.maple4ever.net/archives/399/#comment-3294</guid>
		<description>&lt;strong&gt;WordPress Related Post for Japanese 導入してみた...&lt;/strong&gt;

				hiromasaさんのページでWordPress Related Post for Japanese Ver.1.0リリースの案内があって、入れてみよう! と思っていたら早速1.01 (バグフィックスリリース)の案内が。
				WordPress Plugins/JSeries » Word...</description>
		<content:encoded><![CDATA[<p><strong>WordPress Related Post for Japanese 導入してみた&#8230;</strong></p>
<p>				hiromasaさんのページでWordPress Related Post for Japanese Ver.1.0リリースの案内があって、入れてみよう! と思っていたら早速1.01 (バグフィックスリリース)の案内が。<br />
				WordPress Plugins/JSeries » Word&#8230;
<div class="comment-next"><a href="http://kunik.no-ip.com/2008/08/13/2354/wordpress-related-post-for-japanese-%e5%b0%8e%e5%85%a5%e3%81%97%e3%81%a6%e3%81%bf%e3%81%9f.html">[続きを読む]</a></div>
]]></content:encoded>
	</item>
</channel>
</rss>
