【英語の方が語彙は豊富】という見解が全く理解できなかったので dlit さんと Mitchara さんに質問してみた記録

この記事は11分で読めます

中高の数学の復習から専門的な数学・物理までいろいろな情報を発信しています.
中高数学に関しては中高数学駆け込み寺,
大学数学に関しては現代数学観光ツアーという無料の通信講座があります.
ご興味のある方はぜひお気軽にご登録ください!

全く理解できなかったので,
少し dlit さんと Mitchara さんに伺ってみた.

Mitchara さんに教えて頂いたページから,
メモがてらいくつか引用.

The executive summary: Depending on what you count and how you count them, you can get a lot of different vocabulary-size numbers from the same text. And then once you decide on a counting scheme, there’s an enormous amount of variation across speakers, writers, and styles. And in comparing languages, it’s hard to decide what counts as comparable counting schemes and comparable ways to sample sources.

話すとき, 書くときとスタイル (これが何を意味するかきちんとわかっていない) で
変わるという発想自体がなかった.
素人の浅薄な認識を突き付けられて泣いた.

But how many different vocabulary items — word types — are they?

word types は vocabulary items と思えばいいらしい.

カウントに対する微妙な問題は次の説明がわかりやすかった.

Are these three items, just as written? Or should we count the noun language plus the plural marker -s and the possessive ‘s? Or should we just count one item language, which happens to occur in three forms?

Your question also includes the strings am, are, be, is, was — are these five distinct vocabulary items, or five forms of the one verb be? How about the strings weeks, weekly, day, daily? Is weekly the same vocabulary item as an adjective (“on a weekly basis”) and an adverb (“published weekly”)? If we analyze weekly as week + -ly and significantly as significant + -ly, are those (sometimes or always) the same -ly?

この周辺に書いてある他の具体例もそれぞれ示唆的なのだが,
きりがないのでここだけ引用した.

Answers to various kinds of questions about word analysis will have different quantitative impacts on word counts in different languages. For example, like most languages, English has plenty of compounds (newspaper, restroom), idioms (red herring, blue moon), and collocations (high probability vs. good chance) whose meaning and use are not (entirely) compositional. It’s not obvious where to stop counting. But our decisions about such combinations will have an even bigger impact on Chinese, where most “words” are compounds, idioms, or collocations, made out of a relatively small inventory of mostly-monosyllabic morphemes (e.g. 天花板 tian hua ban “ceiling” = “sky flower board”), and where the writing system doesn’t put in spaces, even ambiguously, to mark the boundaries of vocabulary items.

カウントのときの文節区切り,
確かに技術的な課題になる.
機械翻訳や音読ソフトでも
この辺難しいとか聞いている.

Does this indicate that Spanish has a much richer vocabulary than English, and that Arabic is lexically even richer yet? No, it mainly tells us that Spanish has more morphological inflection than English, and Arabic still more inflection yet.

inflection がよくわからないので ここ から引用する.

Notation: inflections are written as a single letter following a colon, which is added to the word-class of the word concerned; e.g. a past-tense full verb is ‘V:a’, and a singular common noun is ‘N:s’.

An inflection is a general type of word identified by its inflectional morphology, in contrast with lexemes, which ignore inflectional morphology. For example, Singular and Plural are inflections, whereas DOG and CAT are lexemes, giving a two-way classification of every noun in terms of its inflection and its lexeme:

inflection lexeme
DOG CAT MOUSE PERSON
singular dog cat mouse person
plural dogs cats mice people

あとこんなの.

But remember that different sources of speech transcriptions or written text within a given language may display vocabulary at very different rates. To characterize differences between languages, we’d have to compare distributions based on many sources in each language. However, there may be no non-circular way to choose our sources that doesn’t conflate linguistic differences with socio-cultural differences.

Let’s consider two extreme socio-cultural situations in which the same language is spoken:

(1) High rate of literacy, and a large proportion of “knowledge workers”. Many publications aimed at various educational levels.

(2) Low rates of literacy; most of population is subsistence farmers or manual laborers. Publications aim only at intellectuals and technocrats (because they’re the only literate people with money).

現代英語と外の文化・文明・概念を
取り込んでいない先住民族の言語の
語彙比較に何か意味があるのか,
という程度のことは考えたのだが,
こう明晰に言葉にできていなかった.

追記

補足が来るかもしれないといういい話.
タダでこんなに聞いてしまっていいのか感もある.

あとこれに続いて少しやりとりがあってので
それもメモしておこう.
本当に楽しい.

やはり語彙という言葉の定義と
意味のある比較ができるかという点で,
かなりつらい話という印象がある.

何にせよ, 元発言の人の見解,
感覚的にはそれっぽくて言いたいことは何となくわかるが,
それをサポートする理由として挙げられたことが
全く理解できない.

追記 2

真紀奈イケメンエリート太郎さんとのやりとりが
個人的に面白かったので記録.

ルーン文字についてはゲームやらラノベやらで
出てきたのを Wikipedia でちょろっと調べたときに知った.

こういうのをフックにしていろいろなことを学んできたし,
小ネタとして紹介していきたい.

やりたいことたくさんあって困るくらいだ.

追記 3

dlit さんから待望の新記事が来た.
細かいことを言う前に記事を読んでほしい.

とりあえず語彙の定義だけ引用しておく.

「語彙」の定義

さて、具体的な話に入る前に言語研究(日本語学)での「語彙」の定義について書いておきます。

「語彙」の定義:「語」の集合

ホントに基本これだけです。以下引用。

日本語学など言語に関する専門研究では、一般に、語彙とは語の集合であると規定される。すなわち、一定の条件に合致する語のグループを語彙と呼ぶのであ る。たとえば、「『万葉集』の語彙」という場合には、『万葉集』に出てくるというのを条件とし、その条件に合致する語をひとまとめにしてそう呼ぶのであ る。

(斎藤倫明・石井正彦 (2011)「第1章 単語と語彙・語彙論に関する規定」斎藤倫明・石井正彦(編)『これからの語彙論』: 3)

【「語」を数えることの難しさ】のところの方言の例がやばい.
こんなのがあるのかと衝撃を受けた.

あとこれが気になる.

ただ、それでも専門用語や新語・ジャーゴンなどをどれぐらい考慮するかといった頭の痛い問題は色々ありそうです。

いわゆる卑語とか罵詈雑言の語彙が気になった.
で, Wikipedia 先生にちょっと聞いてみた.

卑語

卑語(ひご、英語: Swear Words)とは、現代では下品な言葉、卑猥な言葉をいう。もとは田舎の言葉、または世俗の言葉(鄙言:ひげん)の意であった。しばしば侮蔑の感情を含ん だり、怒りを伝える罵詈雑言、罵倒語となることもあり、合わせて「卑罵語」(英語 profanity)と呼ばれる。改まった場ではもちろん、人前で用いるのは慎むべきとされる。

【もとは田舎の言葉、または世俗の言葉(鄙言:ひげん)の意であった】という話ではあるが,
次のところが気になった.

排泄物 – くそ、うんこ、しっこ

【うんち】とか【おしっこ】だとだいぶ柔らかくなる印象がある.
幼児語 (?) というカテゴリなのかもしれない.
よくわからないが,
よくわからないということがわかった,
というやつだ.

読書案内の本もめっちゃ読みたい.

ご興味のある方はメルマガ登録してください

どうしても達成したいことがある,
受験に成功することで人生を変えたい,
自信を持てるように自分自身を鍛えたい,
自分が望む未来に向かって突き進みたい,
そんな自分の可能性を信じる人に向けたメルマガも発行しています.
この無料メルマガについては こちら からお気軽に登録を.
大学受験向け無料メルマガ

私自身, 白血病で体力がなく,
治療で家計が圧迫されていて
塾・予備校・オンラインスクール・通信教育といった
教育サービスが受けづらい状況にありました.
そうした方でも無理なく勉強でき,
一流の教育が受けられるようにすることを目指し,
特に自学自習・独学の支援に力を注いでいます.

また数学・物理に関する濃い情報を提供するメルマガを発行しています.
こちら からメルマガ登録できるのでぜひご登録ください.


中高の数学の復習から専門的な数学・物理までいろいろな情報を発信しています.
中高数学に関しては中高数学駆け込み寺,
大学数学に関しては現代数学観光ツアーという無料の通信講座があります.
ご興味のある方はぜひお気軽にご登録ください!

  • このエントリーをはてなブックマークに追加
  • LINEで送る

関連記事

  • コメント (0)

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。

このサイトについて

はじめまして。相転移Pです。数学・物理の情報を中心にアカデミックな話題を発信しています。このサイトを見て興味があればぜひご連絡ください。 mail: phasetr@gmail.com LINE: oxg2753d
  • このエントリーをはてなブックマークに追加
  • LINEで送る

現代数学観光ツアー

神秘的な自然現象など冒険心をくすぐる数学世界を堪能してみませんか?
現代数学観光ツアーと称して無料の通信講座形式であなたを数学の名所に案内していきます.
ご興味のある方はぜひこちらからご登録ください!

YouTube チャンネル登録

講義など動画を使った形式の方が良いコンテンツは動画にしています。ぜひチャンネル登録を!

メルマガ登録

メルマガ登録ページからご登録ください。 数学・物理の専門的な情報と大学受験向けのメルマガの 2 種類があります。

役に立つ・面白い記事があればクリックを!

記事の編集ページから「おすすめ記事」を複数選択してください。