Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Unification of Japanses terminology #40

Open
36 tasks done
nzw0301 opened this issue Jun 13, 2016 · 10 comments
Open
36 tasks done

Unification of Japanses terminology #40

nzw0301 opened this issue Jun 13, 2016 · 10 comments

Comments

@nzw0301
Copy link
Collaborator

nzw0301 commented Jun 13, 2016

I want to unify terminology for more useful docs.

I found some different written forms

  • Numpy Array -> Numpy配列
  • . -> .
  • , -> ,
  • : -> :
  • ; -> ;
  • ( ) -> ()
  • str -> 文字列
  • boolean -> 真理値
  • int -> 整数
  • float -> 浮動小数点数
  • optimizer -> 最適化(アルゴリズム)
  • Arguments -> 引数
  • input shape -> 入力のshape
  • output shape -> 出力のshape
  • Return -> 戻り値
  • Sequential Model -> Sequentialモデル
  • Functional API -> Functional API
  • Recurrent -> Recurrent
  • metrics -> 評価値
  • EOS -> です/ます
  • See something -> ~~を参照
  • whether insert space or not before/after syntax highlight in sentence -> No
  • Data augmentation -> データ拡張
  • objective -> 目的関数
  • loss function -> 損失関数
  • training -> 学習
  • testing -> テスト
  • validation -> 検証
  • index -> インデックス
  • target -> ターゲット
  • layer -> レイヤー
  • shape -> shape
  • numbers (1 or 一) -> 1
  • regularizer -> 正則化
  • nD tensor -> n階テンソル
  • Fuzz factor -> 微小量

For example, shape is translated to "形状", "形" and "型" for now.

I think that translation to follow Japanses Python docs is easy for built-in.

thanks.

@henry0312
Copy link
Contributor

henry0312 commented Jun 13, 2016

  • It's better to use '.' and ',' , instead of '。' and '、'.
    (note that those are double-byte character)
  • Return is "戻り値"
  • Arguments is "引数"

I think.

@fchollet
Copy link
Member

Indeed. This is the consequence of many people working on the translation at once. Unification of terminology would be great to have!

@nzw0301
Copy link
Collaborator Author

nzw0301 commented Jun 13, 2016

I think

  • "(", ")", ";" and ":" are ascii strings (not double-byte character)
    • insert one space after ")", ";" and ":".
    • insert one space before "(".
  • insert one space before/after syntax highlight in a sentence

@nzw0301
Copy link
Collaborator Author

nzw0301 commented Jun 13, 2016

How do we decide unification of terminology?

@henry0312
Copy link
Contributor

"(", ")", ";" and ":" are ascii strings (not double-byte character)

since we use basically double-byte character, it's better to use ",", "." as double-byte character.

insert one space after ")", ";" and ":".
insert one space before "(".

Addtionaly, if "(" and ")" are double-byte character, we can ignore these.

@nzw0301
Copy link
Collaborator Author

nzw0301 commented Jun 13, 2016

Addtionaly, if "(" and ")" are double-byte character, we can ignore these.

I'm concerned about being mixed "(", ")" in Python syntax with "(", ")",
but I think that it is easy to use double-byte character for translation.

Sounds good!

@henry0312
Copy link
Contributor

You have a point.
It's bother to confirm which to use double-byte characters or not.
Go ahead 👍

@Wakamatz
Copy link
Contributor

Wakamatz commented May 7, 2017

I think that we should discuss in Japanese when discussing about Japanese translation.
Allow me following in Japanese.

現在nzw0301さんのところでKeras2についての翻訳がだいぶ進んでいますが,未だに翻訳のガイドラインが定まっていないのは問題だと考えています.
このようなものは統一されていることが重要だと思うのでまずはガイドラインを作りましょう.
下記の内容でいかがでしょうか?
よろしければ「Guidlines.md」と「TranslationTable.md」でPRします.

他に追加すべき項目や修正・削除すべき箇所があればご指摘下さい.

  • Guidlines.md

ガイドライン

  • 翻訳対象は本文とコード中のコメントとする.
  • 本文は敬体(です・ます調)とする.
  • 句読点は「,.」を用いる.
  • '',""は基本的にそのままとする.強調の意味で使用されている場合のみ「」に変換する.(bckend.md3行目)
  • 記号「,.()?!:;」は全角とする.
  • 文中のシンタックスハイライト(syntax highlight)の前後に空白は入れない.
  • 用語の訳は対訳表に従う.
  • Kerasの頭文字は大文字とする.

※ 翻訳は英語から日本語へのただの変換作業ではなく,英文の意味を読み取り,日本語として表現する創作作業です.
英語の言い回しに引きずられることなく自然な日本語を目指しましょう.


  • TranslationTable.md

原則

  • 構文キーワードなどはそのまま英語表記とする.

対訳表

English 日本語
Arguments 引数
Data augumentation データ拡張
layer レイヤー
loss function 損失関数
Return 戻り値
Recurrent 再帰
shape 形状
target ターゲット
testing 検証
training 学習

※ 見つけやすいようにアルファベット順で列挙しています.
必要に応じて追記してください.


@nzw0301
Copy link
Collaborator Author

nzw0301 commented May 7, 2017

Thank you for your comment.
I don't have enough time now, sorry for not discussion.

I think that README.md contains this guildline for easier access to it.

I guess that it is unnecessary to translate some technical terms and python/numpy/keras unique terms into ja for searchability.
e.g. Recurrent and shape.

And 検証 means validation, not testing.


コメントありがとうございます.
ここしばらく時間がないので,すぐに議論ができないことお許し下さい.

これらのガイドラインを含めるとしたらアクセス性のためにREADME.mdに追記すべきだと思っています.

検索性のためにpython/numpy/keras特有の単語は翻訳する必要は無いと考えています.
例えば,Recurrentshapeです.

検証はvalidationの訳であり,testingとは別だと思いました.

@Wakamatz
Copy link
Contributor

Wakamatz commented May 8, 2017

アクセス性のためにREADME.mdに追記すべき

それではREADME.mdに追記する形にしましょう.

検索性のためにpython/numpy/keras特有の単語は翻訳する必要は無いと考えています.

これは良い考えだと思うので対訳表の前に明記します.
また,線引を明確にするため原語表記のものについても対訳表に追記します.

対訳表の変更分は下記のとおり.

English 日本語
recurrent recurrent
shape shape
testing テスト

問題があれば後で改めれば良いと思うので,ここまでの内容でkeras-2の方にPR上げておきます.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants