문자열(string)이란 기호의 순차 수열을 말한다.
개요
문자열(string)은 말 그대로 문자들의 열이다. 한마디로 문자들의 집합이다. 문자열에 대한 예를들면 'A'는 문자이지만, 'ABCD'는 문자열이다. 즉 문자가 여러개 모인것을 지칭한다. 문자는 char형 변수에 저장이 된다. 간단한 코드로 보면,
char a = 'A';
char b = 'D';
와 같이 저장하면 된다. char형은 1바이트로 할당되며 문자는 1바이트로 저장이 가능하다는 말이다.
특징
char형 변수로 문자열을 저장하기에는 당연히 무리가 따른다. char형 변수는 문자 1개만을 저장하기 위한 변수이기 때문이다. 문자열을 저장하기 위해서는 char형 배열이 필요하다. 예를 들어 5글자의 문자를 저장하고자 한다면 크기가 5인 char형 배열을 생성하여 저장하면 된다.
가운데 보이는 것처럼 1바이트당 한글자가 저장이 되며 배열의 크기는 지정이 가능하다. 문자열은 이처럼 char형 배열로 저장이 가능하다.
문자상수/문자열상수
문자상수는 'A'와 같이 ' ' 로 표현한다. 상수라고 해서 숫자만 있는 것이 아님을 유의하자. 문자 상수란 문자의 값이며 변하지 않는 수이다. 예를 들어서 'A'라고 하면 이 A는 문자값이다. 하지만 char A; 라고 하면 이 A는 문자값이 아니라 문자를 저장하기 위한 변수다. A라고 하는 이름은 변하지 않지만 그 안에 들어가는 문자상수(값)은 언제든 변할수 있기 때문이다.
유사하게 문자열상수란 문자열값을 의미하며, " " 로 표현한다. "Hello", "Be Happy~" 와 같은 것들이 문자열상수이다.
문자열의 초기화
문자열을 초기화하는 방법(문자배열의 초기화)에는 3가지 정도 생각해볼 수 있다.
char str[6]= { 'H', 'e', 'l', 'l', 'o'. '\0'};
char str[6]= "Hello";
char str[]= "Hello";
A는 크기가 6인 문자배열을 선언하고 각 자리에 들어갈 문자를 순서대로 지정해주는 것이다. B는 크기가 6인 문자배열을 선언함과 동시에 문자열을 대입하는 방법이다. " " 로 표현해주면 되겠다. 주의할점은 크기가 6이므로 이 크기를 벗어나는 문자열상수는 초기화할 수 없다. C는 문자열상수로 초기화하지만 배열의 크기를 지정하지 않는다. 이런경우 문자열상수의 크기에 따라 자동으로 str배열의 크기를 지정해주게된다. C가 문제도 없고 가장 편해보이지만, 문자열이 긴 경우에 개발자가 그 크기를 직접 계산해서 알고 있어야 한다는 불편함이 따른다. 직관적으로 크기도 알고 문자열도 알수 있는 B가 가장 무난하다고 생각할 수 있겠다.
문자열의 출력
저장한 문자열을 출력에 대해 printf 함수만을 예로 들어 설명한다. printf함수를 사용할때는 우리는 출력되는 형태를 지정하기 위해서 형식지정문자 또는 서식문자 라고 불리우는 %로 시작하는것을 붙힌다. 예를 들어 %d는 십진수정수 형태로 출력하라는 %x는 16진수, %lf는 double형타입, %o, %u 등등 여러가지가 지정되어 있다. 하지만 우리의 관심사는 문자와 문자열이므로 여기에만 포커싱을 하고 설명한다. 문자는 %c로 출력한다. 이부분은 아마 다 알고 있을 것이다. 문자열은 %s로 출력하면 된다.
char c ='A';
char str[10]= "ILoveYou";
이제 출력하려면,
printf("%c", c);
printf("%s", str);
%s로 지정을 하면 되고 자 그런데 이에 대응되는 변수부분이 str 즉 배열의 이름이 된다. 그런데 가만히 보니 str은 배열의 이름이고, 배열의 이름은 바로 이 배열 전체를 대표하는 이름이자 첫번째 주소값을 가지고 있는 포인터의 성질을 갖는다고 하였다. 사실 printf도 함수이니 저 str은 함수의 매개변수가 되는 것이다. 자 printf함수가 문자열을 출력할때는 이 문자열이 저장되어 있는 가장 첫번째 주소값을 주면 출력해준다는 사실을 알 수 있다. 즉 %s를 이용해 문자열을 출력할때 이에 대응되는 우측부분에 들어가는 데이터의 타입은 바로 char* 이다.
NULL 문자('\0')
NULL 이라는 문자는 상징적으로 사용되며 사실상 그 값은 0이다. 문자는 역슬래쉬0 = \0으로 표현한다. 문자열은 항상 마지막 공간에 이 널문자 1개를 포함하고 있다. 만약 'ILoveYou'를 저장하고 싶다면 실제 문자는 8개지만 마지막에 널문자가 추가되어 있어야만 한다. 3번의 초기화 방법에서 A는 각 메모리공간 하나하나를 지정하고 있기때문에 반드시 마지막에 널문자를 넣어주어야 한다. B와 C같은 경우는 문자열 상수로 초기화되므로 자동으로 들어가게 된다. 즉 안보이지만 분명 1바이트를 차지하고 있는 널문자가 존재하고 있는 것이다. 따라서 우리는 char형 배열에 문자를 저장하고 싶다면 반드시 문자의 갯수 + 1에 해당하는 크기를 할당해놓아야 제대로 된 저장이 가능하다.[1]
각주
참고자료
같이 보기
이 문자열 문서는 프로그래밍에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.
|
개발 : 프로그래밍 □■⊕, 소프트웨어, 데이터, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
프로그래밍 언어
|
ASP • C 언어 • C++ • C# • CSS • D 언어 • HTML • HTML5 • JSP • PHP • R • XHTML • XML • XSLT • 고(Go) • 고급언어 • 기계어 • 델파이 • 러스트 • 루비 • 루아 • 리액트 • 리퀴디티 • 무브 • 미켈슨 • 베이직 • 브이비스크립트 • 비주얼 C++ • 비주얼베이직(VB) • 비주얼베이직닷넷(VB.NET) • 솔리디티 • 스몰토크 • 스위프트 언어 • 스칼라 • 스크립트 언어 • 알골 • 어셈블리 • 언리얼스크립트 • 얼랭 • 에이잭스(Ajax) • 엠에프씨(MFC) • 오브젝티브-C • 오브젝트 파스칼 • 오카멜 • 웹어셈블리(WASM) • 이와즘(eWASM) • 자바 • 자바스크립트 • 저급언어 • 제이슨(JSON) • 제이쿼리(jQuery) • 카멜 • 코볼 • 코틀린 • 콜드퓨전 • 타입스크립트 • 파스칼 • 파워스크립트 • 파이썬 • 펄(Perl) • 포트란 • 프로씨(Pro-C) • 피엘에스큐엘(PL/SQL) • 피엘원(PL/I) • 하스켈
|
|
개발방법론
|
CBD 개발방법론 • EA • 구조적 개발방법론 • 객체지향 개발방법론 • 라이브러리 • 람다 아키텍처 • 모듈 • 모듈화 • 벤치마킹 • 소프트웨어 개발방법론 • 스크럼 • 스프린트 • 아키텍처 • 아키텍트 • 애자일 • 웹개발방법론 • 정보공학 개발방법론 • 컴포넌트 • 테일러링 • 템플릿 • 폭포수 모델 • 프로젝트 • 프로토타입 • 피드백
|
|
코딩
|
EUC-KR • UTF-8 • 값 • 글루웨어 • 노팔로우 링크 • 두팔로우 링크 • 디버깅 • 디코딩 • 마크업 • 버그 • 부트스트랩 • 세이브포인트 • 소스코드 • 시큐어코딩 • 아스키 • 액티브엑스 • 오픈소스 • 유니코드 • 인코딩 • 재컴파일 • 주석 • 컴파일 • 컴퓨터 프로그램 • 코드 • 코딩 • 태그 • 테스트 • 테이블 • 텍스트 • 파싱 • 퍼블리싱 • 퓨니코드 • 하드코딩 • 하이퍼링크 • 하이퍼텍스트
|
|
프로그래밍
|
C 명령어 • 객체 • 객체지향 • 객체지향 프로그래밍 • 거짓 • 관계연산자 • 기본형 변수 • 널 • 논리 • 논리연산 • 논리연산자 • 다중상속 • 다형성 • 대입 • 대입문 • 대입연산자 • 더블 • 도스 명령어 • 디폴트 • 레지스터변수 • 루프 • 리눅스 명령어 • 리턴 • 메모리 주소 • 메소드 • 멤버 • 명령문 • 명령어 • 무한루프 • 문자 • 문자열 • 바이트 • 반복문 • 배열 • 변수 • 분기 • 분기문 • 불린 • 브레이크 • 비교연산자 • 비트연산자 • 산술연산자 • 상속 • 상수 • 생성자 • 선언 • 선언문 • 설정자 • 속성 • 스위치 • 스태틱 • 시프트연산자 • 실행 • 실행문 • 어노테이션 • 에코 • 역참조 • 연산 • 연산문 • 연산자 • 오버로딩 • 오버라이딩 • 외부변수 • 윈도우 명령어 • 유닉스 명령어 • 인스턴스 • 인스트럭션 • 인클루드 • 인터페이스 • 임포트 • 입력 • 입력문 • 입출력 • 입출력문 • 자료형(데이터 타입) • 자바 명령어 • 자바 예약어 • 자바 컬렉션 • 전역변수 • 접근자 • 접근제어자 • 정보은닉 • 정수형 • 정적변수 • 제어 • 제어문 • 제어자 • 조건 • 조건문 • 조건연산자 • 주소 • 증감연산자 • 지역변수 • 참 • 참조 • 참조변수 • 초기화 • 추상메소드 • 추상클래스 • 추상화 • 출력 • 출력문 • 캡슐화 • 케이스 • 클래스 • 파라미터(매개변수) • 파이널 • 패키지 • 퍼블릭 • 포인터 • 프라이빗 • 프로텍티드 • 필드(멤버변수) • 함수 • 환경변수
|
|
명령어
|
abstract • array • boolean • break • byte • case • char • continue • default • double • do while • echo • elif • else • else if • false • final • float • for • gosub • goto • if • if else • import • include • int • join • long • long long • null • print • printf • println • private • protected • public • return • scanf • short • stdio.h • static • string • switch • temp • then • true • unsigned • void • while
|
|
디자인패턴
|
구조패턴 • 동시성패턴 • 동시실행패턴 • 모델-뷰-컨트롤러 패턴 • 상태패턴 • 생성패턴 • 싱글톤패턴 • 아키텍처패턴 • 전략패턴 • 커맨드패턴 • 행동패턴
|
|
프로그래밍 인물
|
귀도 반 로썸 • 그레이스 머레이 호퍼 • 니클라우스 비르트 • 댄 브릭클린 • 더그 커팅 • 데니스 리치 • 리누스 토르발스 • 리처드 그린블라트 • 마거릿 해밀턴 • 마크 앤드리슨 • 빈트 서프 • 빌 게이츠 • 빌 조이 • 스티브 잡스 • 에이다 러브레이스 • 제임스 고슬링 • 척 벤턴 • 켄 톰슨 • 팀 패터슨
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|