ここから本文です

要約について質問です http://seika-kokai.nict.go.jp/jp/whatnew/WhatNewDetai...

このエントリーをはてなブックマークに追加

質問者

choinarumonoさん

2013/9/2222:22:22

要約について質問です

http://seika-kokai.nict.go.jp/jp/whatnew/WhatNewDetail.do;jsessioni...

『連想知識を用いた端的な要約の生成』 概要

>連想知識を用いることにより、冗長な文を端的に要約する手法を提案する。既存の要約は、原文からの重要文抽出や、不要箇所削除などによる文短縮などの手法が主である。これらの手法では、似た概念の言葉が複数存在しても1つにまとめることができず、冗長な文になるという問題があった。そこで、原文から連想できる言葉を多く用意し、その中から2つの基準を最も満たす言葉を端的な要約として出力することで、冗長さを改善できると考えた。1つめの基準は、要約結果が十分に原文の内容を連想できることである。2つめの基準は要約結果から元の文書の内容にないものがなるべく連想されないことである。使用する連想知識には共起を用いる。


この論文を参考に質問します

以下、引用は下記リンクから
http://www.anlp.jp/proceedings/annual_meeting/2010/pdf_dir/PA1-7.pd...


>1 はじめに

>例えば、冗長に記述された「爆弾が爆発した。死傷者が出た。反政府運動がきっかけである。」などの文章であれば、それを端的に表現した「テロ」と要約する、また、「会社に行くために、朝起きて、歯を磨いて、朝食を食べた。書類の整理をした。」という文章であれば「出社準備」という端的な要約を生成することが望ましい。

>本研究では出力を文とすることを目指しているが、現段階では1単語での出力に限っている。この1単語での出力は、応用として文書のカテゴライズに用いることも考えられる。


…これは私が「この場合は文章を短い単語に要約したと言えるでしょう」
あるいは「要約の作業に含まれる」としたものに近いようですが
「端的な要約」とは私が言っていた要約のことでしょうか?


>4.2 出力候補の取得

>要約として出力する単語の候補を取得する。その候補として、入力内の名詞に対する共起語を用いる。これは、入力にあった名詞から連想されやすい名詞ほど端的な要約としてふさわしいと考えたからである。


…ならば、連想した単語を要約に使用してもよいのではないでしょうか?

それとも、この論文は語学に精通していない者によって書かれているのか

ご意見をお聞かせください


『要約文』
特許出願に必要な文書『要約』
聴覚障害者のための『要約筆記文』

それぞれ違うものですが、元となる日本語が先にあったかどうかご存じでしょうか?

この論文の『テキスト自動要約』における要約は日常的な使い方だと感じませんか

補足この論文は高速文字認識アルゴリズムについては書かれていません

文字認識は手書き文字認識のように画像から文字を認識するもので
連想整合法とは文字画像の部分情報から候補を連想するものです

提示した論文の内容は
連想知識を用いて文短縮(端的に要約)する手法についての研究です

質問は、専門的な事柄とは離れて日常の中で
要約が言葉を短くまとめる意で使用されていないかということです

この質問は、ymax_sousouさんに回答をリクエストしました。

閲覧数:
373
回答数:
5
お礼:
50枚

違反報告

ベストアンサーに選ばれた回答

アバター

ID非公開さん

編集あり2013/9/2314:49:34

>しかし、研究者自身が用いている「要約」という言葉は
論文要約での要約とは違っているようです
違っていません。
論文要約も何も、作文であってもレポートであっても、要約の定義は変わりません。
質問者のように、誤った解釈をする人がいるので、私はこの論文の連想の使い方は間違っていると言いました。
この論文の研究者は、『共起リスト』としています。
日常の連想とは全く違います。

>ですから、日常的には文章を短くまとめることを要約と言ったり
上記と同じ理由で、連想で短くまとめた文章を要約とは言いません。
しかし、その連想からうかんだ言葉が、万人にとって同じ意味であれば要約と言えることを否定しません。

―――――――

この論文では、研究者の言う共起リストにない語句は、始めから捨てています。
共起リストに当てはまる語句から選択することを論じているのであり、それを科学的に証明しようとしたものです。
日常の個人の空想や連想と同一には考えられません。

さらに、選択された語句は、万人が納得できるものでなければ要約にはなりません。
どんな文章にも当てはめられるものでは無いということです。

>私が言いたいのは日常での要約や連想の使い方です
であるなら、質問そのものを良くお考えになることをお勧めします。

――――――

例題は万人が『端的に表した語句』だと万人が納得できるものであって、それはどんな文章にもあてはまるものではありません。


質問者さんの別IDですね。
論文云々言う前に、知恵袋のマナーや利用方法も理解していないようですが

日常の要約ってなんなんでしょう。

『やりたくてやりたくてたまらないのはお前か?』を『ヤリマン女、お前か』に変換しちゃった人のことでしょうか?
もちろん要約ではありません。

その論文の連想とは、万人に一致することを示しています。
よって、連想の使い方が間違っていると言えます。

あなたのように、ネットで拾った一部を見て誤った判断をする人がいるからです。

論文なら私も書いています。
論文どころか、出版されている物にも誤った研究は多くあります。
この論文全てを読んだわけではないので論文の評価はできませんが、あなたがそうであるように誤解を与える表記であるのは確かです。

ーーーーーー

この論文は、連想という言葉の使い方が誤っています。
端的に表すことと、連想は全く違うものだからです。

「爆弾が爆発した。死傷者が出た。反政府運動がきっかけである。」
これを端的に表すとテロであるのは、政府活動がきっかけとあることから想像できます。

しかし、この文章から何が連想できますか?
とした場合、それは人それぞれです。
連想はその人の体験やその時の心理状態で

質問した人からのコメント

2013/9/24 17:14:44

論文要約とは別に「要約」という
日本語があるかという質問でした

しかし語源を知っている知らない
といった意見も聞けませんでした

直接そのものを再認する以外は
連想して情報を思い出すのでは?

わからないから質問しているのに
知ったかぶりもないと思いますが
雑談回答での中傷にも呆れました

JUMANについては先に調べましたが
ご回答から新たな疑問が湧きました

別IDでの補足に対し話を逸らさず
ご意見くださった方をBAにします

どもです

  • このエントリーをはてなブックマークに追加
簡単にみんなで作るショート動画アプリ Yahoo!Chocotle for Android(無料)
ベストアンサー以外の回答
1〜4件/4件中
並び替え:回答日時の
新しい順
|古い順

2013/9/2323:36:34

その補足をうけてjunikuousanosaiが回答をつけたのかな

ちょいたんまさん
論文に書いてることが読めなくて勝手にそんな解釈しちゃったなら
あんた、かなりかっこ悪いというより かなり恥ずかしいことになっちゃったね

気の毒におもうよ、がんばって!

編集あり2013/9/2322:55:06

choinarumonoさんのためにハッキリと言います。

あなたは、あなた自身がよく理解できてないものを出して、
thothothonthonさんが言う連想と混同した上で質問を立てたから
ymax_sousouに馬鹿にされているのでしょう。

まずthothothonthonさんが連想したというのはこれです。
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1411350910...


一方、あなたがここで言ってるものはJUMAN version 5.1という
日本語形態素解析システム(プログラム)の一つによる
連想知識を用いた端的な要約の生成における論文の内容です。
これはコンピュータ関連の情報処理の分野の研究になります。

また、そこに書いてるようにJUMAN version 5.1に連想知識を
インプットするにあたり、連想パターンは文内共起を使用したと明確に書かれています。

つまり極めて簡単に短く言えば、
ここであなたが言う連想とthothothonthonさんが連想したものは別種であるということになります。


ymax_sousouさんが言ってることはさらに高度化したもので
たしか東北大学で研究され論文が出ています。


あなたが言うJUMANの方は形態素解析で、
言語の最小の意味の単位である形態素を入力文から抽出する解析技術です。

また、JUMANに採用されている最小コスト法ではまず、
辞書を参照して入力文中の各位置から始まる単語を取り出し、
単語と単語の連接可能性をチェックしながら取り出された単語をつないでいく
という二つの処理を繰り返し行うことによって、単語をノードとするラティス
構造を生成する処理がおこなわれます。

ここで、この二つの処理を実行する際には、単語の品詞、読み、活用形などを
規定する単語辞書と、行列の形式で連接可能な二語を規定する連接可能性辞書とが必要となります。

最小コスト法による形態素解析では、形態素の連結の規則を二語の間に存
在する連接可能性に一般化し、また、品詞選択の規則に関しては各単語が
独立に品詞と対応する規則に一般化します。

これらはそれぞれ連接可能性辞書と単語辞書の参照に相当し、
こうした一般化に伴なって解析結果は複数得られることになるため、
最小コスト法は単語の品詞選択と、二語の連接にコストを与えることによって
解析結果に優先順位を付与し、曖昧性の解消を図っていると
工学博士の山下浩一氏が解説されています。


あなたがここに書いている連想とは、
JUMAN version 5.1に連想知識を辞書としてインプットするにあたり、
その連想パターンとして文内共起を使用したと明確に書かれていることから、
thothothonthonさんが連想したものとは全く別ものとなり、
あなたが言っていることはまったくの的外れとなるのは、
口は悪いですが、ymax_sousouさんの言う通りです。


また、thothothonthonさんが連想するようなものを要約に使うのは誤りです。
これはドザエモンさんが直接thothothonthonさんに回答するそうなので、
私も、ここではあえて回答しません。



※ここに書いてある辞書とは、プログラムに与えるパラメータとしての単語集のことです。

ymax_sousouさん

リクエストマッチ

編集あり2013/9/2321:48:01

補足、それがそうなんだよ。

ちゃんと書いてるだろ【原文から連想できる言葉を多く用意し、その中から2つの基準を最も満たす言葉を端的な要約として出力することで】って。その計算方法までそこに載ってるだろ。

おまえは、いったいどこを読んでるんだ?

それに、コンピュータにプログラムした「連想知識として文内共起を用いた」と書いてる時点で、そこの連想とトトンが言う連想は違うものになるのは字が読めれば理解できるだろ、普通に。

ちゃんと読め。

読めないなら、知ったかして、まったく的外れなものを持ち出すな。

いいか、おまえは単なる知ったかで、まったく違うものを持ち出してしまったとうこと。

だから、バカかと言われる。

わかったか?

======================

m9。゚(゚^Д^゚)゚。プギャーハハ八八ノヽノヽノヽノ \ / \/ \
おまえは、相当頭が悪いな。


『連想知識を用いた端的な要約の生成』の 概要 とは、自動要約をおこなうプログラムのアルゴリズムについて書かれているもので、コンピュータの判断結果を導く連想整合法のことだ、つまり連想整合法に基づく高速文字認識アルゴリズムによってコンピュータが自動要約する際の結果を検証してるものだ。バカが。


理解できるか?そこにハッキリとこう書いてるだろ。


【本稿では、連想知識として文内共起を用いることにより端 的な要約を生成する手法を提案した。本手法では出力の候補 が複数存在するため、その候補の中から要約にふさわしいも のを選定する条件を用意し、計 5 通りの手法による出力を評 価した。その結果、最も良い手法では lenient において MRR 値が 0.447 となった。また同様の手法により、10 位以内に正 解といえる要約を 75%の精度で取得することができた。 今後の課題としては、並び替えの結果、正解となる語がよ り上位になるように条件を追加・変更する必要がある。また、 1単語のみに要約を行うのではなく、複数の単語を要約とし て表示し、より入力の意味を保持した要約を生成する必要が ある。】



簡単に言えば、すごくバカなことに、人間が文章要約において連想を用いないという要約のコツとは全く無関係のことを、お前は胸をはって堂々と書いてるということだ。

すげえウケる。マジで声出して笑った。
。゚(゚^Д^゚)゚。ギャハハ八八ノヽノヽノヽノ \ / \/ \


そこに書いてる文章が難しすぎて理解できなかったか?


それとアルゴリズムにおける連想はトトンがいう連想とはちがう。おまえは、同じだと思って、その頓珍漢なリンクを書いたのか?
。゚(*゚´∀`゚)゚ノ彡☆ギャハハ八八ノヽノヽノヽノ \ / \/ \

だとしたら、相当なバカだな、おまえって。


トトンが言ってるのは自分の頭に浮かんだ連想。

お前がリンクしたものは連想整合法に基づく高速文字認識アルゴリズムの件で、そのリンクでは連想パターンに文内共起が限定として用いられているもの。


おまえがリンクに示した連想はトトンが言う連想とは違い、連想整合法のこと、これはベクトル量子化を用いたパタン整合法に基礎を置きながら、文字の部分情報を積極的に利用して,高速化を計っているところに大きな特徴があると言われるもの。連想整合法を用いた認識実験では、プリンタによる印刷漢字(字種2965)に対し、1位認識率を99.87%に確保しながら、スピードを全数整合法の5倍程度速くできることを示す。また、手書き文字(字種3036)に対し、100位累積認識率を全数整合法と同じ99%台に確保しながら、スピードを約4倍程度速くできることを示すことができる。おまえが出したリンクは連想パタンを文内共起として限定して自動要約に使った場合どうなるかということ。


おまえさ、あれだけ無知なくせに知ったかぶりはやめろと言われ続けてきたのに、まだ分かってないの?
しかもこんな恥ずかしい質問を一般カテに質問しちゃって。


お・ま・え・は・論・外・だ・か・ら・出・直・し・て・こ・い。


それと、この的外れの質問を絶対に取り消すなよ。
絶対に取り消すなよ。


ちょいたんまが終わってしまった証拠になるから、絶対に消すなよ。


あと、なぜ、要約に個人の連想を使わないかはドザエモンがトトンに証拠を示して回答するから、あえてここでは回答しない。



補足、それと、ちょいとんま、おまえ、そこに連想には文内共起を用いたと書いてるだろ。
共起ってどんなことか調べてみろ。あと、連想整合法や連想アルゴリズム、自動要約アルゴリズムも調べろ。

トトンが言ってる連想とは全く違うから、これを機に知ったかはよせ。

トトンが言ってる連想はこっちの方→http://dic.yahoo.co.jp/dsearch?p=%E9%80%A3%E6%83%B3&enc=UTF-8&stype...


わかったか?

編集あり2013/9/2318:28:09

回答者さんへ


>この論文は、連想という言葉の使い方が誤っています。


「共起」についての知識があっておっしゃっておいでなのでしょうか?

それに、私が言いたいのは日常での要約や連想の使い方です

論文を書くような人が自然に使っているのはなぜでしょうか



>端的に表すことと、連想は全く違うものだからです。


それについてはTさんが繰り返した説明を基にすれば
連想される語句の中から端的な要約に最適なものをセレクトする
ということではないでしょうか



>知恵袋のマナーや利用方法も理解していないようですが


これまでの質問で、コピペ回答による横レスで嫌がらせをされました
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1211303946...

その中にいる方から質問内容と関係ない謂れのないことで責められました
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1211335682...

上記の投稿で横レスの全てに補足で対応するのは困難だと学びました


q12113039462でリクした相手はご自分の質問で別IDを使用なさっています

投票にならない限り自分の別IDをBAにすることはないのでご安心ください



>日常の要約ってなんなんでしょう。


論文とは関係なく「要約」という日本語があったかどうか

もしくは、論文から離れて日常で使用する言葉になっていないか

ということです



>(略)に変換しちゃった人のことでしょうか?


それは質問内容と直接関係ありません

私が話題にしたTさんの説明は
要約のことを連想だと言ったのではないという話です



>その論文の連想とは、万人に一致することを示しています。


そうではありません

概要にもあるように、原文から連想できる言葉を多く用意して
基準に照らすことで端的な要約として出力するということなので
選択される前に用意された言葉は原文から連想できる言葉になります

あなたは、基準によって評価される前と後を区別できていないように思われます



>日常の個人の空想や連想と同一には考えられません。

>選択された語句は、万人が納得できるものでなければ要約にはなりません。


しかし、研究者自身が用いている「要約」という言葉は
論文要約での要約とは違っているようです

ですから、日常的には文章を短くまとめることを要約と言ったり
ある言葉に関連した言葉を想起するのを連想と言うのではないかという話です



>作文であってもレポートであっても、要約の定義は変わりません。


他の方のご説明だと、要約は要点をまとめることなので
極めて短い文章を言い換えて単に短くするのは要約ではない、
また、連想は個人的に思い浮かべることなので要約とは無関係とのこと

しかし、原文に書かれている論点を含む共起語は存在します

私は最初、共起語と関連が強い言葉を出力するのだと思い論文を読み進めましたが
要約として出力する単語の候補に入力内の名詞に対する共起語を用いるとのこと

つまり、連想される中から要約に最適な単語を選ぶらしい



>この論文の研究者は、『共起リスト』としています。日常の連想とは全く違います。


『3 共起語の定義』によると、5,000万のWeb文書内に存在する各文に対し
共起関係にある2つの名詞と、その共起頻度をリスト化したものを用いる
とのことなので実在する文書が基になっています

この研究が日常の作業でないのは当然ですが
説明に用いられている要約・連想は専門用語ではないと感じました



>連想からうかんだ言葉が、万人にとって同じ意味であれば要約と言える


簡単に言えば、それを質問しています

Tさんは思い浮かんだ言葉を吟味したとおっしゃっています

「~なのか」「~だ」という違いはありますが単語の選択に話を限定します

「お前は~ですか」という質問が嫌がらせであれば
「お前は~です」と言ったのと同じことですが、この質問には関係ありません

Q&Aをキーワードで検索:

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

ID/ニックネームを選択し、「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問や知恵ノートは選択されたID/ニックネームのMy知恵袋で確認できます。

ほかのID/ニックネームで利用登録する