FC2ブログ

【大喜利DB】投票順番と得票数の関係

2012/09/01追記
※このエントリ内容が大変、怪しい内容であるとの疑いがあります
 「あーあやっちまったなーコイツ」くらいのテンションでお読みください

  ってかごめんなさいいいいい。本当に申し訳ないです。

 反省と辱めの意味を込めてエントリだけは消さずにとっておこうかなと思います


大喜利DBを作り始めて3年くらいになるかと思いますが
これまで、直接得票率に結びつくようなものは作ってきませんでした。

なぜなら、
「作ったところで、面白いボケに得票が入る」という原則は
変わってないからです。

「1位のボケなにが面白いんだろう?わからん…」っていうのは
CGIの頃から思ったことは何度もあるし
近頃のPHP見ても面白いボケが1位になってると思いますよ

おっと話が横道にそれた!

*************************************************

今回は「投票順番と得票数の関係」について調べてみました

投票画面に移って自分のボケが一番上になったとき、私は
「あーなんかイヤな位置にいるなー」って感じちゃいます
だって一番上のボケって「採点基準になっちゃう」ような気がするんです
体操競技とかフィギュアスケートでもそうだと思ったな

他にもさ、投稿人数が多いと、30番目くらいの位置に面白いボケあっても
「もっと下にもっと面白いボケあるかもー」って思って
(一応チェックは入れておくけど)最終的には下の方のボケに
入れちゃうんです

つまり投票順番によって得票数の有利不利があるかどうか
今回は検証してみました。

***************************************************
対象データ 緑の部屋1~170000回

抽出方法
CSVデータに入っている投稿回ごとのデータに上から昇順に番号を符番
この符番を「投稿順番」とします

1回の投稿者数が
①10~30人の場合
②30~50人の場合
③50~75人の場合
④75~100人の場合
⑤100人オーバー

の5パターンに分けてそれぞれの投稿順番ごとの得票数を合計
だいたいどのあたりの得票順番になれれば得票が期待できるか
をグラフにしてみました

①10~30人の場合
10-30

だいたい雰囲気がわかればいいと思います。
棒グラフが長い箇所が得票数が多い投稿順番になります
一番左が得票順番1、一番右が得票順番30になります

こうも露骨な結果になるとは思いませんでした。

でもまーね、この集計結果って
投稿数15人の場合も含まれてまして
投稿数15人なら投稿順番20とかってありえないじゃないっすか
そういう結果の積み重ねが影響してるのかなー?って

②30~50人の場合
30-50
…あれぇ?さっきの図とあまり変わらない曲線になったぞ??

③50~75人の場合
50-75
得票数がそこそこあるのが投稿順番50くらいまででそれ以降は
急激に落ちてますよね

ボケを審査する集中力って数じゃなくって、「半分よりちょっと行った位」まで
しか持たない…そういった印象覚えてしまいます

④75~100人
75-100
あーーやっぱそうだよ!
投票順番1~10くらいにまず得票が集中して
以降小さなピークはありつつも減少傾向

投票順番の75%までで全得票数の95%が占められているわけですわコレ

⑤100人OVER
100-

もはや黒いカタマリだったり200人以上が参加したことなんか
何回あるんだよって話ですがそれでも得票の傾向はシッカリ
出てるんじゃないかなって思います

数学的に考えれば右肩下がりの表にはなるものの
もうちょっとなだらかな坂を作るんじゃないかなって
思うんですよ

これがもっと極端な表になりましたね
勝手な想像をするに、上から順番に見ていって面白いもの
先着2ボケに票を入れて、投票完了…ってやってる方が多い…
ってのが俺の予想です

…ハイ、以後、気をつけます…

逆に言うとさ、エンペラー戦とかでも、どのタイミングで投稿すれば
票数が伸びやすいか、ってのもわかったんじゃないでしょうか?

ヒュー♪今回の大喜利DB参考になるぅ♪
(終わり)
スポンサーサイト



コメントの投稿

非公開コメント

No title

決定的なデータが出てしまったなと思いました。

このデータ以後は投票順をコントロールできるのは
ありえない。

そんな事すら思うデータですね。

No title

***へは゜さん***

大喜利PHPやる人は感覚的に
「どの辺で投稿すればどの辺の投稿順番になるか」
「なんとなく早い目が有利っぽい」
みたいなのは知ってるとは思ってたけど
はっきりでちゃいました

でもこれから例えば投稿順番ヒトケタの争いが
発生しようとも相対的に投稿順番は決まるので
あからさまなことにはならないと思ってます

No title

今の、10事に写真やボケが入るようになった、
レオパルド後の数字も出して頂けませんかね?
実験なのと、今は改善されてるかもしれないという
希望がありまして。
177000くらいからです

No title

***へは゜さん***

実はですね…
持ってるcsvデータが170000回まで、なんですね。
それ以降についてはcsvのダウンロードのページを
削ったようでしたので、それ以降のデータは
ないんです。申し訳ないです

でも、10ごとの区切りで変わるかなぁ…
俺なんか区切りゼロで設定して
仕様は前と変わらないようにしてるから
余計にそう感じるだけかもしれないですが。

No title

データは今もなお
http://oogiri.symphonic-net.com/two/data/log*****.csv.gz
でダウンロードできます。
*****の部分は数字で、10000回のデータがほしければ100で割った数字、つまり00100といった具合です。
赤い部屋のデータは今は移動したので詳しくは本部スレへ。

ひとつ思ったんですが、結果として残っているCSVデータは「投稿順」ではなく、「票数順」なのではないか、と。
同票数なら投稿順になっていますが、一番最後に投稿しても1位なら1番目になってログが残っているので、投稿順である、というのは間違っている気がするのですが・・・

No title

***赤い人さん***

おお!これなら引き続きデータがとれる!
サンキューレッドヒューマン!

csvデータ順番の件

csvの生データは確かに得票数順になってますね
(実は今はじめて確認しました…)

でもこれをmdbに取り込むと別なソートがかかるんですよ

例えば緑の部屋の投稿第1回の場合
csvデータ上だと
01 おしりの日
02 バイカル湖
03 パラドクス的なね

と並んでますが
mdbにデータを取り込むと
01 ペッパー
02 赤い人
03 シュリンプ

って並ぶんです

投稿者名やボケのあいうえお順とかでもなさそうだったんで
投稿順だって思い込んじゃってましたわ

あーなんか信憑性なくなってきますねorz

No title

☆追記

投稿回196048回で検証してみました。

投稿順番
01 あいりん  あと一機足す
02 九官鳥と猫@美術鑑賞  気管支にサイコロ詰まったことある  
03 ミニミニ三村  小堺一機容疑者

結果
01 ヤマモト  小堺一機 -NINKU-
02 あたしゃ江戸っ子恋泥棒 小堺一機が愛したワッペン
03 ししゃも@レトロゲーム ブルーレイレコーダーから失礼します、小堺一機です。

取り込み順番
01 スカイハイ 小堺一機の湯
02 ニコルスキー大佐  小中大堺一二三機
03 だみ声angel  小堺一機13:00

となりました
投稿者名のソートでもボケのソートでも
得票数でもないとするとなんなんだろ…

なんにせよあてにならないデータを作ってしまった
ことは明らかになりました。

No title

ドンマイです!
どっちにしろ、すごくはっきりした傾向が出ていて
興味深いデータであることに変わりはないので、
どういうことなのかぜひ解明して欲しいです!
プロフィール

うーちゃん@狼

Author:うーちゃん@狼
skype:u-chan_1222
どしどしどーぞ

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード