このサイトは学部では早稲田で物理を, 修士では東大で数学を専攻し, 今も非アカデミックの立場で数学や物理と向き合っている一市民の奮闘の記録です. 運営者情報および運営理念についてはこちらをご覧ください.
中高の数学の復習から専門的な数学・物理までいろいろな情報を発信しています.
中高数学に関しては自然を再現しようや役に立つ中高数学 中高数学お散歩コース
大学数学に関しては現代数学観光ツアーなどの無料の通信講座があります.
その他にも無料の通信講座はこちらのページにまとまっています.
ご興味のある方はぜひお気軽にご登録ください!
@NStyles @poyopoyochan ぶっちゃけ英語の方が語彙は豊富だし、覚える必要ある文字数も少なくて日本語より優れてると思う。言葉に秘めた深い感情、とかなら世界中どの国にもあるのよねー、サウダーデとかエグザイルとか。
— ももも(pop3) (@Vertex3on500mbp) 2015, 7月 30
https://t.co/lmKq5D85QH 英語の方が語彙が豊富というのの根拠が気になる。どうやって測定しているのかも気になる
— 相転移P(市民) (@phasetr) 2015, 7月 31
@phasetr 世界の技術書、文学賞、標準語教室は英語よ
— ももも(pop3) (@Vertex3on500mbp) 2015, 7月 31
@Vertex3on500mbp 英語で適切に対応する単語や表現がない場合といった評価の仕方を私は知らないので、それで語彙の豊富さが測れるとする理由がわかりません
— 相転移P(市民) (@phasetr) 2015, 7月 31
@phasetr 英語はいくらでも単語を足せば表現できるけど、日本語には英語の文字を正確に伝える文字が見つからないこともある、だからGoogle翻訳は日本語相手だと使えない
— ももも(pop3) (@Vertex3on500mbp) 2015, 7月 31
@Vertex3on500mbp 全体的にわかりませんが、英語では「単語を足す」と言いつつ「日本語は文字が見つからない」と言っていて、単語と文字の比較をされていますし、そもそも提示された例・言明が適切な内容なのかどうかが私には判断できません。Google翻訳との関係も不明です
— 相転移P(市民) (@phasetr) 2015, 7月 31
全く理解できなかったので,
少し dlit さんと Mitchara さんに伺ってみた.
@dlit @Mitchara どなたに伺えばいいのかもわからないのですが https://t.co/lmKq5D85QH https://t.co/fMsRP6bRth という主張はどの程度の妥当性を持つのでしょうか。私は言語学的な【語彙】や【豊富さ】の定義も理解できていなくて
— 相転移P(市民) (@phasetr) 2015, 7月 31
@phasetr @Mitchara うーん私もあまり調べたことがないのですが、語(彙)ってどんどん新しいのが作れちゃうのである程度範囲を限って語彙数(量)の比較をすれば比べられないことはないですけど、その結果が「○○語の方が語彙が豊富」と言えるかどうかはなんとも…
— Takumi TAGAWA (@dlit) 2015, 7月 31
@dlit @phasetr @Mitchara これも専門ではないのですが英語がいろいろな分野の共通語になっているのは社会的・歴史的な要因も大きいかと。あといわゆるアルファベット系の文字は確かに文字の種類は少ないですけどその分組み合わせ(スペル)を覚えないといけないので…
— Takumi TAGAWA (@dlit) 2015, 7月 31
@dlit @phasetr 英語の語彙項目数だとOEDの見出し語数が挙がったりしますけど、あれは単に覇権言語で大規模な辞書があるというだけですしね…
— Sasaki Mitsuya (@Mitchara) 2015, 7月 31
@Mitchara @phasetr そうなんですよねえ。辞書の項目数はわかりやすいんですけど、OEDも日国も基本的に現在は使用語彙ではないものも載っていたりしてかえってややこしい気がします
— Takumi TAGAWA (@dlit) 2015, 7月 31
@dlit @Mitchara ありがとうございます。元の発言者の説明が全く理解できないので、まずはその理解からやっていきます
— 相転移P(市民) (@phasetr) 2015, 7月 31
@phasetr @Mitchara いえいえ。やりようがないわけではないのですが、印象論レベルをこえてそれなりの話をするにはけっこうやっかいな問題だなーとは思います。
— Takumi TAGAWA (@dlit) 2015, 7月 31
@phasetr @dlit Vocabulary sizeで検索するとそれなりに経験的なレポートも出てきます。大規模なコーパスでコーパスサイズを横軸、異なり語数を縦軸にして曲線を作るとか。 http://t.co/OC4HmalgmA
— Sasaki Mitsuya (@Mitchara) 2015, 7月 31
@dlit @phasetr ナバホ語のように、動詞語根の数が比較的少なくて、活用や派生や複合語で複雑な意味を表す言語と、英語のように分解不能な語根の数自体が多くて類義語が豊富という言語があるので、そういう意味で語彙規模に言語差は出ると思います。
— Sasaki Mitsuya (@Mitchara) 2015, 7月 31
Mitchara さんに教えて頂いたページから,
メモがてらいくつか引用.
The executive summary: Depending on what you count and how you count them, you can get a lot of different vocabulary-size numbers from the same text. And then once you decide on a counting scheme, there’s an enormous amount of variation across speakers, writers, and styles. And in comparing languages, it’s hard to decide what counts as comparable counting schemes and comparable ways to sample sources.
話すとき, 書くときとスタイル (これが何を意味するかきちんとわかっていない) で
変わるという発想自体がなかった.
素人の浅薄な認識を突き付けられて泣いた.
But how many different vocabulary items — word types — are they?
word types は vocabulary items と思えばいいらしい.
カウントに対する微妙な問題は次の説明がわかりやすかった.
Are these three items, just as written? Or should we count the noun language plus the plural marker -s and the possessive ‘s? Or should we just count one item language, which happens to occur in three forms?
Your question also includes the strings am, are, be, is, was — are these five distinct vocabulary items, or five forms of the one verb be? How about the strings weeks, weekly, day, daily? Is weekly the same vocabulary item as an adjective (“on a weekly basis”) and an adverb (“published weekly”)? If we analyze weekly as week + -ly and significantly as significant + -ly, are those (sometimes or always) the same -ly?
この周辺に書いてある他の具体例もそれぞれ示唆的なのだが,
きりがないのでここだけ引用した.
Answers to various kinds of questions about word analysis will have different quantitative impacts on word counts in different languages. For example, like most languages, English has plenty of compounds (newspaper, restroom), idioms (red herring, blue moon), and collocations (high probability vs. good chance) whose meaning and use are not (entirely) compositional. It’s not obvious where to stop counting. But our decisions about such combinations will have an even bigger impact on Chinese, where most “words” are compounds, idioms, or collocations, made out of a relatively small inventory of mostly-monosyllabic morphemes (e.g. 天花板 tian hua ban “ceiling” = “sky flower board”), and where the writing system doesn’t put in spaces, even ambiguously, to mark the boundaries of vocabulary items.
カウントのときの文節区切り,
確かに技術的な課題になる.
機械翻訳や音読ソフトでも
この辺難しいとか聞いている.
Does this indicate that Spanish has a much richer vocabulary than English, and that Arabic is lexically even richer yet? No, it mainly tells us that Spanish has more morphological inflection than English, and Arabic still more inflection yet.
inflection がよくわからないので ここ から引用する.
Notation: inflections are written as a single letter following a colon, which is added to the word-class of the word concerned; e.g. a past-tense full verb is ‘V:a’, and a singular common noun is ‘N:s’.
An inflection is a general type of word identified by its inflectional morphology, in contrast with lexemes, which ignore inflectional morphology. For example, Singular and Plural are inflections, whereas DOG and CAT are lexemes, giving a two-way classification of every noun in terms of its inflection and its lexeme:
inflection lexeme DOG CAT MOUSE PERSON singular dog cat mouse person plural dogs cats mice people
あとこんなの.
But remember that different sources of speech transcriptions or written text within a given language may display vocabulary at very different rates. To characterize differences between languages, we’d have to compare distributions based on many sources in each language. However, there may be no non-circular way to choose our sources that doesn’t conflate linguistic differences with socio-cultural differences.
Let’s consider two extreme socio-cultural situations in which the same language is spoken:
(1) High rate of literacy, and a large proportion of “knowledge workers”. Many publications aimed at various educational levels.
(2) Low rates of literacy; most of population is subsistence farmers or manual laborers. Publications aim only at intellectuals and technocrats (because they’re the only literate people with money).
現代英語と外の文化・文明・概念を
取り込んでいない先住民族の言語の
語彙比較に何か意味があるのか,
という程度のことは考えたのだが,
こう明晰に言葉にできていなかった.
追記
まとめありがとうございます。補足で何か書きます。 / “【英語の方が語彙は豊富】という見解が全く理解できなかったので dlit さんと Mitchara さんに質問してみた記録 – 相転移プロダクション相転移プロダクション” http://t.co/a6uhC7Nu7C
— Takumi TAGAWA (@dlit) 2015, 8月 5
補足が来るかもしれないといういい話.
タダでこんなに聞いてしまっていいのか感もある.
あとこれに続いて少しやりとりがあってので
それもメモしておこう.
本当に楽しい.
現実に各言 語が使われている局面の多様さが違うので、言語本来の語彙の豊富さがほとんど評価不可能になっていると思います。現実の語彙量は、専門文献が記述される言 語とそうでないものの格差が大きく、もし日常会話の文脈に限っても、専門用語からの影響は避けられないと思います。@dlit
— MASUDA Kooiti (@masuda_ko_1) 2015, 8月 5
@masuda_ko_1 結局、そういう話になってしまうと思います。比較するには相当範囲を限定するぐらいしかないと思いますが、そうすると「○○語の語彙は(××語より)豊富」という話からは遠ざかるような気がします
— Takumi TAGAWA (@dlit) 2015, 8月 5
各言語が初 等・中等・高等教育の教科書類のどのレベルまでをカバーしているか (できれば、地の文は自国語でも専門用語の語彙が外来語ばかりになっているかどうかも判別して) 比較して見ることができるとおもしろいと思っています。わたしの関心は科学論的な方向からのものですが。@dlit
— MASUDA Kooiti (@masuda_ko_1) 2015, 8月 5
(これはもちろん、現実に教育体制が実施されているもとでの語彙の話題であって、いわゆる各言語本来の語彙の豊かさの話題からは離れています。) @dlit
— MASUDA Kooiti (@masuda_ko_1) 2015, 8月 5
@masuda_ko_1 教科書に使われている語彙、ということであれば、言語によってはコーパス・データベースが作成されていると思うので、比較的調べやすいと思います。訳語や外来語の割合も出せそうですが…
— Takumi TAGAWA (@dlit) 2015, 8月 5
@dlit @masuda_ko_1 ただ、国によっては特定の教科をそもそも英語など第二言語でやっているところもあったと思いますので、どれぐらいの言語で比較可能なデータが取れるかはわかりませんが
— Takumi TAGAWA (@dlit) 2015, 8月 5
@dlit 全くの素人考えなのですが、使用人数が多い言語のほうが方言やスラングなどが多くなるのでしゃべっている人の数と語彙数が関連する、というようなことはないのでしょうか?
— saebou (@Cristoforou) 2015, 8月 5
@Cristoforou 私もほぼ素人みたいなものなのですが、ご指摘のポイントの他にも他言語との接触などでも語彙の流入が起きますので、使用者数が増えるとそういった可能性が増えるという点で語彙数との間に関連はありそうです
— Takumi TAGAWA (@dlit) 2015, 8月 5
やはり語彙という言葉の定義と
意味のある比較ができるかという点で,
かなりつらい話という印象がある.
何にせよ, 元発言の人の見解,
感覚的にはそれっぽくて言いたいことは何となくわかるが,
それをサポートする理由として挙げられたことが
全く理解できない.
追記 2
真紀奈イケメンエリート太郎さんとのやりとりが
個人的に面白かったので記録.
@phasetr 言語の優劣という論点からして、意志疎通の為の道具としての言語を研究する学問から結構遠くにあるのではないかと思いました
— 真紀奈@ヮ<)ノ♪♪♪ (@tenkafubufubu) 2015, 8月 6
@tenkafubufubu 言語学との関係はともかく、覚える文字数が少ないかどうかくらいは優劣決まるとおもっていいはずなので、それについてはそうですねと答えていきたいです
— 相転移P(市民) (@phasetr) 2015, 8月 6
@phasetr 文字が少ないほど長く複雑なスペルを覚える必要があるので決定的なアドバンテージとは言えないという旨の反論を書きながら気付きましたが、キーボード式の入力装置やタイプライタでは確かに決定的なアドバンテージかなと思いました
— 真紀奈@ヮ<)ノ♪♪♪ (@tenkafubufubu) 2015, 8月 6
@tenkafubufubu それ自体dlitさんも指摘していますが、何かプログラマの人っぽいので、エディタによる補完を考えるなら特に有利不利なさそうです
— 相転移P(市民) (@phasetr) 2015, 8月 6
@phasetr 入力装置がキーボードでなくタッチパネル手書きや音声、脳波等になれば意味の無い差ではありましたしね
— 真紀奈@ヮ<)ノ♪♪♪ (@tenkafubufubu) 2015, 8月 6
@tenkafubufubu ルーン文字のように木片にナイフで刻み込むことで印字(?)していく場合、入力の上で漢字よりは春香に優れているとかそういうのは言えるのではないか説
— 相転移P(市民) (@phasetr) 2015, 8月 6
ルーン文字についてはゲームやらラノベやらで
出てきたのを Wikipedia でちょろっと調べたときに知った.
こういうのをフックにしていろいろなことを学んできたし,
小ネタとして紹介していきたい.
やりたいことたくさんあって困るくらいだ.
追記 3
“英語の語彙は豊富(と言える)かという問いをどう考えればよいか、について補足(ちょっとだけ読書案内付き) – 思索の海” http://t.co/NtcJOzcMEl
— Takumi TAGAWA (@dlit) 2015, 8月 11
dlit さんから待望の新記事が来た.
細かいことを言う前に記事を読んでほしい.
とりあえず語彙の定義だけ引用しておく.
「語彙」の定義
さて、具体的な話に入る前に言語研究(日本語学)での「語彙」の定義について書いておきます。
「語彙」の定義:「語」の集合
ホントに基本これだけです。以下引用。
日本語学など言語に関する専門研究では、一般に、語彙とは語の集合であると規定される。すなわち、一定の条件に合致する語のグループを語彙と呼ぶのであ る。たとえば、「『万葉集』の語彙」という場合には、『万葉集』に出てくるというのを条件とし、その条件に合致する語をひとまとめにしてそう呼ぶのであ る。
(斎藤倫明・石井正彦 (2011)「第1章 単語と語彙・語彙論に関する規定」斎藤倫明・石井正彦(編)『これからの語彙論』: 3)
【「語」を数えることの難しさ】のところの方言の例がやばい.
こんなのがあるのかと衝撃を受けた.
あとこれが気になる.
ただ、それでも専門用語や新語・ジャーゴンなどをどれぐらい考慮するかといった頭の痛い問題は色々ありそうです。
いわゆる卑語とか罵詈雑言の語彙が気になった.
で, Wikipedia 先生にちょっと聞いてみた.
卑語
卑語(ひご、英語: Swear Words)とは、現代では下品な言葉、卑猥な言葉をいう。もとは田舎の言葉、または世俗の言葉(鄙言:ひげん)の意であった。しばしば侮蔑の感情を含ん だり、怒りを伝える罵詈雑言、罵倒語となることもあり、合わせて「卑罵語」(英語 profanity)と呼ばれる。改まった場ではもちろん、人前で用いるのは慎むべきとされる。
【もとは田舎の言葉、または世俗の言葉(鄙言:ひげん)の意であった】という話ではあるが,
次のところが気になった.
排泄物 – くそ、うんこ、しっこ
【うんち】とか【おしっこ】だとだいぶ柔らかくなる印象がある.
幼児語 (?) というカテゴリなのかもしれない.
よくわからないが,
よくわからないということがわかった,
というやつだ.
読書案内の本もめっちゃ読みたい.
ご興味のある方はメルマガ登録してください
どうしても達成したいことがある,
受験に成功することで人生を変えたい,
自信を持てるように自分自身を鍛えたい,
自分が望む未来に向かって突き進みたい,
そんな自分の可能性を信じる人に向けたメルマガも発行しています.
この無料メルマガについては こちら からお気軽に登録を.
大学受験向け無料メルマガ
私自身, 白血病で体力がなく,
治療で家計が圧迫されていて
塾・予備校・オンラインスクール・通信教育といった
教育サービスが受けづらい状況にありました.
そうした方でも無理なく勉強でき,
一流の教育が受けられるようにすることを目指し,
特に自学自習・独学の支援に力を注いでいます.
また数学・物理に関する濃い情報を提供するメルマガを発行しています.
こちら からメルマガ登録できるのでぜひご登録ください.
中高の数学の復習から専門的な数学・物理までいろいろな情報を発信しています.
中高数学に関しては自然を再現しようや役に立つ中高数学 中高数学お散歩コース
大学数学に関しては現代数学観光ツアーなどの無料の通信講座があります.
その他にも無料の通信講座はこちらのページにまとまっています.
ご興味のある方はぜひお気軽にご登録ください!
この記事へのコメントはありません。