"해시"의 두 판 사이의 차이
fshiel8165 (토론 | 기여) |
fshiel8165 (토론 | 기여) |
||
1번째 줄: | 1번째 줄: | ||
− | '''해시'''(hash, 哈希)란 다양한 길이를 가진 [[데이터]]를 고정된 길이를 가진 데이터로 [[매핑]](mapping)한 값이다. '''해시값'''이라고도 한다. '해쉬'가 아니라 '해시'가 올바른 표기법이다. 해시는 [[블록체인]](blockchain)을 구현하기 위한 핵심 기술이다. | + | '''해시'''(hash, 哈希)란 다양한 길이를 가진 [[데이터]]를 고정된 길이를 가진 데이터로 [[매핑]](mapping)한 값이다. 이를 이용해 특정한 배열의 인덱스나 위치나 위치를 입력하고자 하는 데이터의 값을 이용해 저장하거나 찾을 수 있다. 기존에 사용했던 자료 구조들은 탐색이나 삽입에 선형시간이 걸리기도 했던것에 비해, 해시를 이용하면 즉시 저장하거나 찾고자 하는 위치를 참조할 수 있으므로 더욱 빠른 속도로 처리할 수 있다. '''해시값'''이라고도 한다. '해쉬'가 아니라 '해시'가 올바른 표기법이다. 해시는 암호학에 있어서 매우 중요한 요소이며, [[블록체인]](blockchain)을 구현하기 위한 핵심 기술이다. |
+ | |||
+ | == 개요 == | ||
+ | |||
+ | 해시는 특정한 데이터를 이를 상징하는 더 짧은 길이의 데이터로 변환하는 행위를 의미한다. 여기서 상징 데이터는 원래의 데이터가 조금만 달라져도 확연하게 달라지는 특성을 가지고 있어 무결성을 지키는 데에 많은 도움을 준다. 예를 들어 'A'라는 문자열의 해시와 'B'라는 문자열의 해시는 고작 한 알파벳이 다를뿐이지만 그 결과는 천차만별이라는 것이다. 대표적인 해시 알고리즘인 [[MD5]]는 어떠한 입력값을 넣든 항상 각양각색의 32자리 16진수 값을 반환한다. | ||
+ | |||
+ | == 활용 == | ||
+ | |||
+ | 해시는 [[블록체인]]과 [[IPFS]] 등 다양한 분야에서 활용되고 있다. 보안 분야에서도 널리 사용되는데 이는 해시 함수가 원래의 문장을 복호화할 수 없게 뭉개버린다는 장점과 원문과 해시값 사이에 선형적 관계가 없다는 특성을 지니고 있기 때문이다. 해시 함수의 결과물은 고정된 길이의 숫자이므로, 원래의 정보는 손실되는데, 이러한 특성 때문에 하나의 원 데이터는 하나의 해시값만 가지지만, 하나의 해시값을 만들어 낼 수 있는 원본 데이터는 매우 많아서, 해시값만 가지고는 아무리 용을 써도 이미 뭉개져버린 원문을 복원해해는 것은 불가능하다. 따라서 비밀번호, 전자서명, 전자투표, 전자상거래와 같은 민감한 입력의 무결성을 검증할 때 주로 사용된다. 따라서 데이터의 무결성과 직접적인 연관이 있기 때문에 어떤 해시 함수에서 해시 충돌이 일어나기 쉽다는 것은 보안 분야에서는 매우 민감한 문제에 해당한다. | ||
+ | |||
+ | === 해시함수 === | ||
해시함수(hash function)는 결정론적으로 작동하기 때문에, 원래의 데이터가 같으면 해시값도 항상 동일하다. 하지만 서로 다른 데이터가 동일한 해시값을 가질 수 있기 때문에 해시충돌이 발생할 수 있다. | 해시함수(hash function)는 결정론적으로 작동하기 때문에, 원래의 데이터가 같으면 해시값도 항상 동일하다. 하지만 서로 다른 데이터가 동일한 해시값을 가질 수 있기 때문에 해시충돌이 발생할 수 있다. | ||
+ | |||
+ | === 해시테이블 === | ||
해시 테이블(hash table)은 키와 값을 매핑해 둔 데이터 구조이다. 해시함수를 이용하여 검색하고자 하는 값을 변환하면 그 값이 저장된 위치를 즉시 알아낼 수 있다. 데이터의 양이 아무리 많아지더라도 원리적으로 해시 변환과 검색에 걸리는 시간은 항상 동일하다. 따라서 방대한 데이터에서 특정한 값을 검색할 때 해시 테이블을 사용하면 검색 시간을 획기적으로 단축할 수 있다. 해시 맵(hash map)은 기존 해시 테이블의 기능을 개선한 신 버전의 해시 테이블이다. | 해시 테이블(hash table)은 키와 값을 매핑해 둔 데이터 구조이다. 해시함수를 이용하여 검색하고자 하는 값을 변환하면 그 값이 저장된 위치를 즉시 알아낼 수 있다. 데이터의 양이 아무리 많아지더라도 원리적으로 해시 변환과 검색에 걸리는 시간은 항상 동일하다. 따라서 방대한 데이터에서 특정한 값을 검색할 때 해시 테이블을 사용하면 검색 시간을 획기적으로 단축할 수 있다. 해시 맵(hash map)은 기존 해시 테이블의 기능을 개선한 신 버전의 해시 테이블이다. | ||
+ | |||
+ | === 해싱 === | ||
해싱(hashing)이란 해시함수를 사용하여 주어진 값을 변환한 뒤, 해시 테이블에 저장하고 검색하는 기법을 말한다. 해싱에 사용되는 [[자료구조]]는 [[배열]](array)과 [[연결 리스트]](linked list)가 조합된 형태이다. | 해싱(hashing)이란 해시함수를 사용하여 주어진 값을 변환한 뒤, 해시 테이블에 저장하고 검색하는 기법을 말한다. 해싱에 사용되는 [[자료구조]]는 [[배열]](array)과 [[연결 리스트]](linked list)가 조합된 형태이다. | ||
− | |||
− | |||
− | |||
해시값을 자동으로 계산해서 알려주는 사이트로 [[깃허브]]의 [[온라인툴즈]]가 있다. 온라인툴즈<!--온라인 툴즈-->(Online Tools)는 알려진 거의 모든 [[해시함수]]를 사용하여, 실시간으로 해시값을 계산해 주는 깃허브의 [[웹페이지]]이다. | 해시값을 자동으로 계산해서 알려주는 사이트로 [[깃허브]]의 [[온라인툴즈]]가 있다. 온라인툴즈<!--온라인 툴즈-->(Online Tools)는 알려진 거의 모든 [[해시함수]]를 사용하여, 실시간으로 해시값을 계산해 주는 깃허브의 [[웹페이지]]이다. | ||
== 참고자료 == | == 참고자료 == | ||
+ | |||
* 비트웹 편집국장, 〈[http://www.bitweb.co.kr/news/view.php?idx=360 블록체인의 기본, 해시란 무엇인가?]〉, 《비트웹》, 2018-02-12 | * 비트웹 편집국장, 〈[http://www.bitweb.co.kr/news/view.php?idx=360 블록체인의 기본, 해시란 무엇인가?]〉, 《비트웹》, 2018-02-12 | ||
* 디센터유니버시티 보스코인, 〈[https://www.sedaily.com/NewsView/1S3E902IZ4 (디센터 용어사전③)해시함수, 해킹이 가능한 듯 불가능…무량대수만큼 시도해야]〉, 《서울경제》, 2018-08-17 | * 디센터유니버시티 보스코인, 〈[https://www.sedaily.com/NewsView/1S3E902IZ4 (디센터 용어사전③)해시함수, 해킹이 가능한 듯 불가능…무량대수만큼 시도해야]〉, 《서울경제》, 2018-08-17 | ||
18번째 줄: | 30번째 줄: | ||
== 같이 보기 == | == 같이 보기 == | ||
+ | |||
* [[블록체인]] | * [[블록체인]] | ||
* [[IPFS]] | * [[IPFS]] |
2019년 7월 23일 (화) 12:42 판
해시(hash, 哈希)란 다양한 길이를 가진 데이터를 고정된 길이를 가진 데이터로 매핑(mapping)한 값이다. 이를 이용해 특정한 배열의 인덱스나 위치나 위치를 입력하고자 하는 데이터의 값을 이용해 저장하거나 찾을 수 있다. 기존에 사용했던 자료 구조들은 탐색이나 삽입에 선형시간이 걸리기도 했던것에 비해, 해시를 이용하면 즉시 저장하거나 찾고자 하는 위치를 참조할 수 있으므로 더욱 빠른 속도로 처리할 수 있다. 해시값이라고도 한다. '해쉬'가 아니라 '해시'가 올바른 표기법이다. 해시는 암호학에 있어서 매우 중요한 요소이며, 블록체인(blockchain)을 구현하기 위한 핵심 기술이다.
개요
해시는 특정한 데이터를 이를 상징하는 더 짧은 길이의 데이터로 변환하는 행위를 의미한다. 여기서 상징 데이터는 원래의 데이터가 조금만 달라져도 확연하게 달라지는 특성을 가지고 있어 무결성을 지키는 데에 많은 도움을 준다. 예를 들어 'A'라는 문자열의 해시와 'B'라는 문자열의 해시는 고작 한 알파벳이 다를뿐이지만 그 결과는 천차만별이라는 것이다. 대표적인 해시 알고리즘인 MD5는 어떠한 입력값을 넣든 항상 각양각색의 32자리 16진수 값을 반환한다.
활용
해시는 블록체인과 IPFS 등 다양한 분야에서 활용되고 있다. 보안 분야에서도 널리 사용되는데 이는 해시 함수가 원래의 문장을 복호화할 수 없게 뭉개버린다는 장점과 원문과 해시값 사이에 선형적 관계가 없다는 특성을 지니고 있기 때문이다. 해시 함수의 결과물은 고정된 길이의 숫자이므로, 원래의 정보는 손실되는데, 이러한 특성 때문에 하나의 원 데이터는 하나의 해시값만 가지지만, 하나의 해시값을 만들어 낼 수 있는 원본 데이터는 매우 많아서, 해시값만 가지고는 아무리 용을 써도 이미 뭉개져버린 원문을 복원해해는 것은 불가능하다. 따라서 비밀번호, 전자서명, 전자투표, 전자상거래와 같은 민감한 입력의 무결성을 검증할 때 주로 사용된다. 따라서 데이터의 무결성과 직접적인 연관이 있기 때문에 어떤 해시 함수에서 해시 충돌이 일어나기 쉽다는 것은 보안 분야에서는 매우 민감한 문제에 해당한다.
해시함수
해시함수(hash function)는 결정론적으로 작동하기 때문에, 원래의 데이터가 같으면 해시값도 항상 동일하다. 하지만 서로 다른 데이터가 동일한 해시값을 가질 수 있기 때문에 해시충돌이 발생할 수 있다.
해시테이블
해시 테이블(hash table)은 키와 값을 매핑해 둔 데이터 구조이다. 해시함수를 이용하여 검색하고자 하는 값을 변환하면 그 값이 저장된 위치를 즉시 알아낼 수 있다. 데이터의 양이 아무리 많아지더라도 원리적으로 해시 변환과 검색에 걸리는 시간은 항상 동일하다. 따라서 방대한 데이터에서 특정한 값을 검색할 때 해시 테이블을 사용하면 검색 시간을 획기적으로 단축할 수 있다. 해시 맵(hash map)은 기존 해시 테이블의 기능을 개선한 신 버전의 해시 테이블이다.
해싱
해싱(hashing)이란 해시함수를 사용하여 주어진 값을 변환한 뒤, 해시 테이블에 저장하고 검색하는 기법을 말한다. 해싱에 사용되는 자료구조는 배열(array)과 연결 리스트(linked list)가 조합된 형태이다.
해시값을 자동으로 계산해서 알려주는 사이트로 깃허브의 온라인툴즈가 있다. 온라인툴즈(Online Tools)는 알려진 거의 모든 해시함수를 사용하여, 실시간으로 해시값을 계산해 주는 깃허브의 웹페이지이다.
참고자료
- 비트웹 편집국장, 〈블록체인의 기본, 해시란 무엇인가?〉, 《비트웹》, 2018-02-12
- 디센터유니버시티 보스코인, 〈(디센터 용어사전③)해시함수, 해킹이 가능한 듯 불가능…무량대수만큼 시도해야〉, 《서울경제》, 2018-08-17
- Online Tools - [1]
같이 보기