Cadenas de Python (con ejemplos)

En este tutorial aprenderá a crear, formatear, modificar y eliminar cadenas en Python. Además, se le presentarán varias operaciones y funciones de cadenas.

Video: cadenas de Python

¿Qué es String en Python?

Una cadena es una secuencia de caracteres.

Un personaje es simplemente un símbolo. Por ejemplo, el idioma inglés tiene 26 caracteres.

Las computadoras no se ocupan de los caracteres, se ocupan de los números (binarios). Aunque puede ver caracteres en su pantalla, internamente se almacena y manipula como una combinación de 0 y 1.

Esta conversión de carácter a un número se llama codificación y el proceso inverso es decodificación. ASCII y Unicode son algunas de las codificaciones más utilizadas.

En Python, una cadena es una secuencia de caracteres Unicode. Se introdujo Unicode para incluir todos los caracteres en todos los idiomas y brindar uniformidad en la codificación. Puede obtener información sobre Unicode en Python Unicode.

¿Cómo crear una cadena en Python?

Las cadenas se pueden crear encerrando caracteres entre comillas simples o dobles. Incluso se pueden usar comillas triples en Python, pero generalmente se usan para representar cadenas de varias líneas y cadenas de documentos.

 # defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)

Cuando ejecute el programa, la salida será:

 Hola Hola Hola Hola, bienvenido al mundo de Python

¿Cómo acceder a los caracteres de una cadena?

Podemos acceder a caracteres individuales mediante la indexación y a un rango de caracteres mediante la división. El índice comienza desde 0. Intentar acceder a un carácter fuera del rango del índice generará un IndexError. El índice debe ser un número entero. No podemos usar flotadores u otros tipos, esto resultará en TypeError.

Python permite la indexación negativa de sus secuencias.

El índice de -1hace referencia al último elemento, -2al penúltimo elemento y así sucesivamente. Podemos acceder a un rango de elementos en una cadena usando el operador de corte :(dos puntos).

 #Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))

Cuando ejecutamos el programa anterior, obtenemos el siguiente resultado:

 str = programiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am

Si intentamos acceder a un índice fuera del rango o usamos números que no sean enteros, obtendremos errores.

 # index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers

El corte se puede visualizar mejor si se considera que el índice se encuentra entre los elementos, como se muestra a continuación.

Si queremos acceder a un rango, necesitamos el índice que cortará la parte de la cadena.

Cortar cadenas en Python

¿Cómo cambiar o eliminar una cadena?

Las cuerdas son inmutables. Esto significa que los elementos de una cadena no se pueden cambiar una vez asignados. Simplemente podemos reasignar diferentes cadenas al mismo nombre.

 >>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'

No podemos eliminar ni eliminar caracteres de una cadena. Pero eliminar la cadena por completo es posible usando la delpalabra clave.

 >>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined

Operaciones de cadenas de Python

Hay muchas operaciones que se pueden realizar con cadenas, lo que lo convierte en uno de los tipos de datos más utilizados en Python.

Para obtener más información sobre los tipos de datos disponibles en Python, visite: Tipos de datos de Python

Concatenación de dos o más cadenas

La unión de dos o más cadenas en una sola se denomina concatenación.

El operador + hace esto en Python. Simplemente escribir dos cadenas literales juntas también las concatena.

El operador * se puede utilizar para repetir la cadena un número determinado de veces.

 # Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)

Cuando ejecutamos el programa anterior, obtenemos el siguiente resultado:

str1 + str2 = ¡HolaMundo! str1 * 3 = HolaHelloHello

Escribir dos cadenas literales juntas también las concatena como operador + .

Si queremos concatenar cadenas en diferentes líneas, podemos usar paréntesis.

 >>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'

Iterando a través de una cuerda

Podemos iterar a través de una cadena usando un bucle for. A continuación se muestra un ejemplo para contar el número de 'unos' en una cadena.

 # Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')

Cuando ejecutamos el programa anterior, obtenemos el siguiente resultado:

 3 letras encontradas

Prueba de pertenencia a cadenas

We can test if a substring exists within a string or not, using the keyword in.

 >>> 'a' in 'program' True >>> 'at' not in 'battle' False

Built-in functions to Work with Python

Various built-in functions that work with sequence work with strings as well.

Some of the commonly used ones are enumerate() and len(). The enumerate() function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.

Similarly, len() returns the length (number of characters) of the string.

 str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))

When we run the above program, we get the following output:

 list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4

Python String Formatting

Escape Sequence

If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError as the text itself contains both single and double quotes.

 >>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax

One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.

An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.

 # using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")

When we run the above program, we get the following output:

 He said, "What's there?" He said, "What's there?" He said, "What's there?"

Here is a list of all the escape sequences supported by Python.

Escape Sequence Description
ewline Backslash and newline ignored
\ Backslash
\' Single quote
" Double quote
a ASCII Bell
 ASCII Backspace
f ASCII Formfeed
ASCII Linefeed
ASCII Carriage Return
ASCII Horizontal Tab
v ASCII Vertical Tab
ooo Character with octal value ooo
xHH Character with hexadecimal value HH

Here are some examples

 >>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation

Raw String to ignore escape sequence

Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r or R in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.

 >>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example

The format() Method for Formatting Strings

The format() method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces () as placeholders or replacement fields which get replaced.

We can use positional arguments or keyword arguments to specify the order.

 # Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)

When we run the above program, we get the following output:

 --- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John

The format() method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <, right-justify > or center ^ a string in the given space.

También podemos formatear enteros como binarios, hexadecimales, etc. y los flotantes se pueden redondear o mostrar en formato de exponente. Hay muchos formatos que puedes usar. Visite aquí para conocer todos los formatos de cadena disponibles con el format()método.

 >>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'

Formato de estilo antiguo

Incluso podemos formatear cadenas como el sprintf()estilo antiguo utilizado en el lenguaje de programación C. Usamos el %operador para lograr esto.

 >>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457

Métodos comunes de cadenas de Python

Existen numerosos métodos disponibles con el objeto de cadena. El format()método que mencionamos anteriormente es uno de ellos. Algunos de los métodos comúnmente utilizados son lower(), upper(), join(), split(), find(), replace()etc Aquí está una lista completa de todos los métodos incorporados para trabajar con cadenas en Python.

 >>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'

Articulos interesantes...