FAQ
훈민바름 FAQ
•훈민바름은 어디에 쓰는 건가요?
훈민바름은 정확한 외국어 발음표기법입니다. 정확한 외국어 발음표기는 시각적으로 비슷한 발음의 비교나 어려운 발음의 분석을 통해 외국어 발음교육에 있어 학습자와 교육자 모두에게 유용하게 쓰일 수 있습니다.
예를 들어, massage와 message 발음을 훈민바름표기를 통해 비교하면 아래와 같습니다.
massage /məˈsɑːʒ/ ‘ᄆᆞ사아ᅆ’
message /ˈmɛsɪdʒ/ ‘메시ᅈ’
기존의 ‘마사지’와 ‘메시지’ 표기로는 알 수 없는 강세의 위치를 글자크기의 차이로 알 수 있습니다. 또한 한국어에 없는 모음 /ə/와 긴모음 /ː/ 그리고 자음 /ʒ/와 /dʒ/를 각각 ‘ㆍ’, ‘아’, ‘ᅆ’ 그리고 ‘ᅈ’로 표기함으로써 한국어 모음 ‘ㅏ’와 자음 ‘ㅈ’로만 표기되어 구분할 수 없던 발음들을 구분할 수 있게 해줍니다.
나아가 한국어를 할 줄 아는 일본인이 영어발음을 훈민바름으로 배우는 것과 같이 한국어를 할 줄 아는 외국인들이 다른 언어를 배울때도 쓰일 수 있습니다. 또한 학술적으로도 LLM, NLP 등 인공지능 분야에서 한국어 corpus의 확장과 indexing 등의 도움이 될 것이라 판단됩니다.
•훈민바름 기호를 봤는데도 못읽겠어요.
훈민바름은 현대한글과 옛한글기호를 섞어서 확장된 한글로 영어발음기호를 정확히 변환해주는 발음표기법입니다. 그렇기때문에 훈민바름 발음기호를 발음하는 방법을 배우셔야 정확하게 발음할 수 있습니다. 예를 들어 ‘ᅋ’는 한국어에 없는 영어 자음소리인 /f/를 표기하지만 유성 순치 마찰음 (Voiced labiodental fricative) /f/ 소리를 내는 방법 (윗니가 아랫입술에 닿은 상태로 성대의 떨림없이 소리내기)은 배워서 익혀야 합니다.
•훈민바름 기호들이 원래 훈민정음에 없거나 발음이 달라요.
외국어 발음을 표기하는 역할을 하는 훈민바름은 태생적으로 언어의 자의성과 사회성을 가지고 있을 수 밖에 없습니다. 훈민바름의 자의성은 그 창작자인 저 스스로가 나름의 언어학적 지식과 기준을 가지고 현재의 훈민바름 발음과 기호 쌍을 만들었지만 개인이 한 일이기 때문에 다분히 주관적이고 임의적일 수 밖에 없습니다. 앞으로 훈민바름이 널리 사용되어 사회성이 커져간다면 사회적 약속에 따라 발전적으로 수정하거나 또는 과거 훈민정음에서 사용하던 발음과의 차이때문에 오해가 생길 수 있는 여지가 크다는 전문가 지적이 있으면 수정될 수 여지가 충분히 있습니다.
현재 훈민바름에서 사용중인 옛한글 기호 중 훈민정음 28자에 포함되었던 ‘ㅿ’, ‘ㆆ’, ‘ㆍ’의 세가지 기호를 제외한 나머지 ‘ᅈ’, ‘ᅉ’, ‘ᅄ’, ‘ᅅ’, ‘ᅂ’, ‘ㅾ’, ‘ᅆ’, ‘ㆀ’, ‘ꥶ’, ‘ᄙ’ 등의 기호들은 모두 훈민정음 창제 이후 조선시대에 외국어 발음을 표기위해 만들어진 기호들입니다.
‘ㅿ’과 ‘ㅾ’: 훈민정음에서는 반시옷 또는 여린시옷 ㅿ을 ㅅ보다는 발음이 여린 것으로 설명하고 있어 유성 치조 마찰음 /z/를 나타내는 것이라 여겨집니다. 주로 음절 사이의 초성에서만 쓰였으나, 15세기 문헌에는 간혹 종성에서의 용례가 보이며, 이 발음 또한 /z/로 추정되고 있습니다. ‘ㅾ’은 훈민정음 28자에 포함되어있지는 않지만 조선시대에 된소리 ‘ㅉ’를 나타내는 기호로 쓰였다는 기록이 있습니다. 과거에 기록된 사용법과 달리 현재의 훈민바름에서 ‘ㅿ’은 /ʃ/를 ‘ㅾ’은 /z/를 표기하는데 사용하고 있습니다. 다분히 주관적일수 있기 때문에 후일 사용자와 전문가 의견을 수렴하여 ‘ㅿ’는 훈민정음과 같이 /z/를 표기하는 것으로 수정하고 ‘ㅾ’은 훈민바름에서 제외할 여지가 있습니다. 훈민정음 언해본의 ‘ㅿ’에 대한 설명은 ‘ㅿ半齒音如穰字初發聲 ㅿ 半반니쏘리니 穰()ㄱ字 처 펴아나 소리 니라’고 되어있습니다.
‘ㆆ’과 ‘ㆀ’: 비공식적 명칭이 '여린히읗' 또는 ‘된이응'인 ‘ㆆ’은 성문 파열음 glottal stop /ʔ/을 표기하는 데에 사용되었고, 쌍이응 ‘ㆀ’은 단지 표기로써 뜻을 구별하는 용도로만 15세기까지 쓰이다가 세조 때 같이 사라졌습니다. 현재의 훈민바름에서 과거에 기록과 달리 ‘ㆆ’은 /j/를 ‘ㆀ’은 /w/를 표기하는데 사용하고 있습니다. 후술한 ‘ᄙ’과 ‘ꥶ’의 경우와 연계해서 수정할 여지가 있습니다. 훈민정음 언해본의 ‘ㆆ’에 대한 설명은 ‘ㆆ喉音如挹字初發聖 ㆆ 목소리니 挹()字 처 펴아나 소리 니라’고 되어있습니다.
‘ᄙ’과 ‘ꥶ’: ‘ㄹ’의 각자병서인 ‘ᄙ’은 훈민정음 23자모에 포함되지 않지만 1518년에 발간한 정속언해에 ‘극ᄙᅡᆨ’이라는 표기가 나오고, 1948년 <들온말 적는법>에서는 /l/의 한글 표기로 'ᄙ'을 쓰자고 규정한 적이 있고 또한 스패인어나 이탈리아어에서 혀를 부르르르 떠는 trilled /r/을 적는 데 쓰이기도 했습니다. ‘ꥶ'은 영어의 'r'인 유성 후치경 접근음 voiced postalveolar approximant /ɹ/로 적은 예가 있습니다. 현재의 훈민바름에서 ‘ꥶ’은 /ɹ/를 ‘ᄙ’은 /ɫ/를 표기하는데 사용하고 있습니다. 다분히 주관적일수 있기 때문에 후일 사용자와 전문가 의견을 수렴하여 ‘ᄙ’은 /ɹ/을 표기하고 종성 ‘ꥶ’이나 다른 기호가 /ɫ/를 표기하는 것으로 수정할 여지가 있습니다.
‘ᅈ’, ‘ᅉ’, ’ᅋ’, ‘ᅄ’, ‘ᅅ’, ‘ᅂ’, ‘ᅆ’: ‘ㅇ’계 겹자음들은 20세기 초중반에 외국어나 외래어 표기를 위해 도입된 것이 많습니다. 현대 한국어에서 ㅇ은 그다지 음성적 특징이 없기 때문에 과거 ㅇ 연서 표기인 ㅸ, ㆄ에서 착안하여 훈민바름과 같이 한국어에 없는 발음들을 표현하려고 노력한 흔적들입니다. 실제로 ‘ᅄ’, ‘ᅋ’은 ‘ㅸ’, ‘ㆄ’과 비슷하고 중 ‘ᅄ’, ‘ᅋ’은 1948년에 규정 표기로 인정받기도 했었습니다. 현재의 훈민바름에서는 ‘ᅈ’은 /dʒ/, ‘ᅉ’은 /tʃ/, ’ᅋ’은 /f/, ‘ᅄ’은 /v/, ‘ᅅ’은 /θ/, ‘ᅂ’은 /ð/, ‘ᅆ’은 /ʒ/을 표기하는데 사용되고 있으나 후일 사용자와 전문가 의견을 수렴하여 수정할 여지가 있습니다.
‘ㆍ’와 모음: 중세 한국어에서 아래아 ‘ㆍ’를 어떻게 읽었을까는 아직 적실한 증거가 없기에 이에 대한 토론이 계속 이어지고 있지만 추정치는 현대 국어의 ‘ㅓ' /ʌ/ 소리라는 설이 그나마 유력합니다. 훈민정음 언해본의 ‘ㆍ’에 대한 설명은 ‘ㆍ如呑字中聲 ㆍ 呑()ㄷ字 가온소리 니라’고 되어있습니다. 현재의 훈민바름에서 ‘ㆍ’는 강세 없는 모음 /ə/을 표기하는데 사용되고 있습니다. /ə/외의 모든 영어모음들은 영국과 미국 내에서도 각 지역에 따른 발음차이가 크기 때문에 사용자와 전문가 의견을 수렴하여 더 세분화하고 수정할 여지가 있습니다.
•실제로 원어민이 말할때내는 소리랑 다르게 들려요. / 연음지원은 무엇이고 언제되나요?
훈민바름에서 사용하고 있는 ChatGPT를 이용해 생성한 발음기호 데이타베이스가 예상보다 오류가 많아 잘못된 발음이 표기될 수도 있는 점 양해 부탁드립니다. 조만간 전수검사를 통한 수정 업데이트를 완료할 예정입니다.
현재 공개된 훈민바름은 자연스러운 대화시의 발음보다는 단어 단위의 또박또박한 발음 (enunciation)을 표기합니다. 원어민들이 대화시의 발음하는 방법은 Catenation (linking words), Intrusion (adding an extra sound), Elision (deleting a sound), Assimilation (joining sounds to make a new sound), Geminates (twin sounds) 등의 연음화 (connected speech)과정에서 지역차 및 개인차가 있기 때문의 현재 공개된 또박또박한 발음과는 차이가 있을 수 있습니다.
훈민바름의 다음 목표중 하나인 다양한 연음표기를 통해서 최대한 자연스러운 외국어 발음을 정확하게 표기하는 것입니다. 현재 2024년 상반기 업데이트를 목표로 하고 있으며 여러분의 따뜻한 응원과 후원에 힘입어 조금이라도 더 빨리 연음화를 지원할 수 있도록 노력하겠습니다.
•음성지원은 무엇이고 언제되나요?
‘백 번 듣는 것이 한 번 보는 것만 못하다’고 하지만 발음학습의 경우 백번 보는 것 보다 한 번 듣는 것이 더 효과적일 수 있습니다.
훈민바름의 다음 목표중 하나인 음성지원은 현재 눈으로만 확인할 수 있는 훈민바름 표기의 정확성을 더 효과적으로 표현할 수 있도록 영국의 ‘O’대학의 API 사용해서 영국과 미국 원어민의 발음을 재생할 수 있는 음성지원을 준비중에 있습니다.
현재 2023년내 업데이트를 목표로 하고 있으며 여러분의 따뜻한 응원과 후원에 힘입어 조금이라도 더 빨리 지원할 수 있도록 노력하겠습니다.
•다국어지원은 무엇이고 언제되나요?
국제적으로 통용되는 IPA를 기반으로 하는 훈민바름은 새로운 기호의 추가를 통해 영국식, 미국식 영어 뿐만이 아니라 IPA로 표기 가능한 모든 언어의 정확한 발음표기가 가능합니다.
아직은 구체적이지 않지만 스패인어, 프랑스어, 독일어, 이탈리아어 등의 다양한 유럽어와 북경어, 광동어, 베트남어, 태국어 그리고 아랍어의 지원을 계획하고 있습니다.
이를 통해 한국어 사용자들에게 익숙하지 않은 언어들의 발음표기를 통해서 더 넓은 세계와 교류하고 소통할 수 있는 길이 열리기를 바라면서 아직 정확한 개발시일이 잡혀있지는 않지만 여러분의 따뜻한 응원과 후원에 힘입어 조금이라도 더 빨리 다국어 발음표기를 지원할 수 있도록 노력하겠습니다.
•입력한 영어단어가 ‘사전에 등록 되어 있지 않은 단어’라고 나와요. 현재 훈민바름은 Google 선정 자주 사용되는 단어 10000여개와 Oxford University Press 선정 3000 단어를 ChatGPT를 사용해서 영국식, 미국식 발음을 구분하여 2 개의 영어단어 데이타베이스를 사용하고 있습니다.
하지만, ChatGPT의 IPA 표기가 정확하지 않은 경우가 많고 절대적인 단어 수가 부족하여 영국 ‘O’ 대학교 사전 API를 사용하여 정확한 발음기호와 음성지원을 포함한 수백만개의 영어 단어를 2023년말까지 지원할 예정입니다. 여러분의 따뜻한 응원과 후원에 힘입어 조금이라도 더 빨리 지원할 수 있도록 노력하겠습니다.
훈민바름에 대한 기술적 문의나 제안을 할 수 있나요?
언제든지 techsupport@hmbr.online로 이메일 보내주시면 최대한 빠른 시일에 답변할 수 있도록 하겠습니다. 또한 앞으로 훈민바름에 대한 기술적 문의나 제안 추후 Discord나 Facebook 등을 사용하여 코뮤니티 활동을 할 예정입니다. 코뮤니티를 운영 또는 관리해본 경험이 있으신 분들의 자원봉사활동도 환영하니 관심있으신 분은 volunteer@hmbr.online로 연락 부탁드립니다.
FAQ
FAQ (English)
•What is HMBR for?
HMBR is a phonetic transcription system for foreign languages. Accurate foreign language transcription can be useful for both learners and educators through visual comparison of similar pronunciations or analysis of difficult pronunciations.
For example, if you compare the pronunciation of ‘massage’ and ‘message’ using HMBR:
massage /məˈsɑːʒ/ ‘ᄆᆞ사아ᅆ’
message /ˈmɛsɪdʒ/ ‘메시ᅈ’
HMBR offers the position of stress by the difference in font size, which is discernable in the conventional Korean transcription of 마사지 and 메세지. In addition, the unstressed vowel /ə/, the long vowel /ː/, and the consonants /ʒ/ and /dʒ/, which do not exist in Korean, are written as 'ㆍ', 'ㅏ', 'ᅆ', and 'ᅈ', respectively, so that the users can distinguish the different phonemes.
Furthermore, Korean speaking foreigners can use HMBR to learn other languages and it is believed that HMBR will be helpful in the expansion and indexing of the Korean corpus in artificial intelligence fields such as LLM and NLP.
•I don’t know how to read the HMBR symbols.
HMBR is a phonetic transcription system that accurately converts English IPA symbols into Hangul by mapping non-Korean phonemes and old Hangul symbols. The old Hangul symbols are archaic and have not been in use for years and modern Korean speakers are not familiar with the symbols and the sound values of them. Therefore, you must learn how to pronounce the HMBR phonetic symbols in order to pronounce it accurately. For example, 'ᅋ' represents the English consonant sound /f/, which does not exist in Korean, and HMBR users must learn how to articulate the voiced labiodental fricative /f/ sound. That is by making the sound without shaking the vocal cords with the upper teeth in contact with the lower lip.
•Old Korean symbols in HMBR do not represent the original Humninjeongeum phonemes.
HMBR as a phonetic transcription system is bound to have inherent linguistic arbitrariness and sociality. As for the arbitrariness of HMBR, I devised the current IPA-HMBR conversion algorithm based on my own, and very limited, linguistic knowledge and since it was an individual effort, it is bound to have left an ample room for improvement. If HMBR gains a wide spread use in the future and it must be modified progressively in accordance with the feedback from the general public and experts in linguistics.
Among the old Hangul symbols currently in use in HMBR, excluding the three symbols 'ㅿ', 'ㆆ', and 'ㆍ' that were included in the 28 characters of Hunminjeongeum, the rest are 'ᅈ', 'ᅉ', 'ᅄ', 'ᅅ', 'ᅂ', 'ㅾ', 'ᅆ', 'ㆀ', 'ꥶ', and 'ᄙ' are in fact the symbols that were created years after the creation of Hunminjeongeum in order to represent foreign language pronunciation during the Joseon Dynasty.
‘ㅿ’ and ‘ㅾ’: In Hunminjeongeum, Bansiot or Yeorinsiot ‘ㅿ’ is loosely defined as having a softer pronunciation than ‘ㅅ’, so it is believed to represent the voiced alveolar fricative /z/. It was mainly used only as an initial consonant between syllables, but in 15th century literature, it is occasionally used as a final consonant, and this pronunciation is also presumed to be /z/. Although ‘ㅾ’ is not included in the 28 letters of Hunminjeongeum, there is a record that it was used as a symbol representing the sound ‘ㅉ’ during the Joseon Dynasty. Unlike the usage recorded in the past, in the current version of HMBR, ‘ㅿ’ is used to represent /ʃ/ while ‘ㅾ’ represents /z/ (which is purely based on my personal preferences!). There is room to reflect opinions from the users including English teachers and experts and modify ‘ㅿ’ to use /z/ like in Hunminjeongeum, and exclude ‘ㅾ’ from HMBR. <Hunminjeongeum Unhaebon> which roughly translates to ‘the book examples of Korean writing’ defines as ‘ㅿ半齒音如穰字初發聲 ㅿ 半반니쏘리니 穰()ㄱ字 처 펴아나 소리 니라’.
‘ㆆ’와 ‘ㆀ’: 'ㆆ', whose unofficial name is 'Yeorinhieut' or 'Doin-i-eung', was used to mark the glottal stop /ʔ/ and the double ieung 'ㆀ' was used only to distinguish meaning as a notation until the 15th century. They both disappeared during the reign of King Sejo. In the current HMBR, unlike past records, ‘ㆆ’ is used to denote /j/ and ‘ㆀ’ is used to denote /w/. There is room for modification in connection with the cases of ‘ᄙ’ and ‘ꥶ’ described later. <Hunminjeongeum Unhaebon> defines ‘ㆆ’ as ‘ㆆ喉音如挹字初發聖 ㆆ 목소리니 挹()字 처 펴아나 소리 니라’.
‘ᄙ’과 ‘ꥶ’: Although 'ᄙ', the double consonant of 'ㄹ', is not included in the 23 Jamos of Hunminjeongeum, a use of it, ’극ᄙᅡᆨ’, is found in a 1518 publiucation called <Jeongsongeonhae> and in <How to Write Adopted Words> in 1948, ‘ᄙ’ was used to represent /l/. It was also used to represent the trilled /r/ in Spanish and Italian. There is an example of ‘ꥶ’ written as the voiced postalveolar approximant /ɹ/, which is the English ‘r’. In the current HMBR, ‘ꥶ’ is used to write /ɹ/ and ‘ᄙ’ is used to write /ɫ/. There is room for modification so that ‘ᄙ’ represents /ɹ/ and the final ‘ꥶ’ or similar represents /ɫ/.
‘ᅈ’, ‘ᅉ’, ’ᅋ’, ‘ᅄ’, ‘ᅅ’, ‘ᅂ’, ‘ᅆ’: Many ‘ㅇ’ series double consonants were introduced in the early to mid 20th century to transcribe foreign words. In modern Korean, ‘ㅇ’ does not have many phonetic characteristics (it was devised as a, initial ‘filler/space holder’ in the first place), so these ㅇ’ series double consonants are traces of efforts to represent phonemes that do not exist in Korean. In fact, and ‘ᅄ’ and ‘ᅋ’ are similar to ‘ㅸ’ and ‘ㆄ’ and ‘ᅄ’ and ‘ᅋ’ were recognized as regulatory notations in 1948. In HMBR, by taking inspiration from the past ‘ㅇ’ series double consonants, ‘ᅈ’ represents /dʒ/, ‘ᅉ’ represents /tʃ/, ‘ᅋ’ represents /f/, ‘ᅄ’ represents /v/, ‘ᅅ’ represents /θ/, ‘ᅂ’ represents /ð/ and 'ᅆ' represents /ʒ/, but there is room for modification in the future.
‘ㆍ’ and vowels: Although <Hunminjeongeum Unhaebon> defines ‘ㆍ’ as ‘ㆍ如呑字中聲 ㆍ 呑()ㄷ字 가온소리 니라’, there is still no adequate evidence on how to read 'ㆍ' in medieval Korean, so debate continues, but the most likely estimate is that it is the 'ㅓ' /ʌ/ sound in modern Korean. In the current version of HMBR, ‘ㆍ’ is used to write the unstressed vowel /ə/. All English vowels other than /ə/, even within the UK and the US, have large regional differences, so there is room for further refinement and modification.
• HMBR sounds different to a native speaker. / What is connected speech and when is it going to be available?
Currently, HMBR relies on the IPA database created using ChatGPT and unfortunately the AI created database contains more errors than expected and incorrect pronunciation may be displayed. We plan to release an update soon.
The currently released version of HMBR displays clear pronunciation (enunciation) on a word-by-word basis rather than natural conversational pronunciation. The way native speakers of English articulate words during conversation can be written using transcrition of connected speech which includes many phonetic features including Catenation (linking words), Intrusion (adding an extra sound), Elision (deleting a sound), Assimilation (joining sounds to make a new sound), and Geminates (twin sounds).
Due to regional and individual differences in the connected speech, there may be differences from the clear pronunciation which HMBR transcribes.
One of HMBR’s next goals is to transcribe the natural pronunciation of foreign languages as accurately as possible through the ability to connect speech. We are currently aiming for an update in the first half of 2024 and with your warm support we will strive to implement connected speech as soon as possible.
•What is audio support and when is it going to be available?
There is a saying in Korean that ‘hearing something a hundred times is not as good as seeing it once’, but in the case of pronunciation learning, hearing it once can be more effective than seeing it a hundred times.
One of HMBR next goals is to implement the playback of the audio recordings of native British and American speakers using API from Britain's 'O' University. Audio support will ensure that the learners and educators alike can utilise HMBR as an education tool in a more effective and efficient way.
We are currently aiming for an update by the end 2023 and with your warm support we will strive to implement audio support as soon as possible.
What is multilingual support and when is it going to be available?
HMBR, which is based on the internationally recognised IPA, enables accurate phonetic transcription of not only British and American English, but also all languages that can be written in IPA by adding new symbols.
Although it is at an infant stage, we are planning to support various European languages such as Spanish, French, German, and Italian, as well as Mandarin, Cantonese, Vietnamese, Thai, and Arabic.
We hope to open a way for Korean speakers to interact and communicate with the wider world through phonetic transcriptions of languages unfamiliar to them. Although there is no exact development date yet, we will strive to implement connected speech as soon as possible with your warm support.
•My word is not registered and can not be displayed.
Currently, HMBR database contains 13,000 words consisting of Google selected 10,000 frequently used words and 3,000 words selected by Oxford University Press.
However, ChatGPT generated IPA transcription are often inaccurate and the absolute number of words is insufficient and we plan to implement the 'O' University Dictionary API to support millions of English words with accurate phonetic symbols and audio support by the end of 2023. With your warm support, we will strive to implement audio support as soon as possible.
•Can I send a technical inquiry or suggestion about HMBR?
Please email us at techsupport@hmbr.online at any time and we will respond as soon as possible. In addition, in the near future, we plan to engage with HMBR community using Discord or Facebook. We also welcome volunteer work from people who have experience operating or managing a community, so if you are interested, please contact volunteer@hmbr.online.