`re` ಮಾಡ್ಯೂಲ್‌ನ ಪ್ರಮುಖ ಫಂಕ್ಷನ್‌ಗಳು

re ಮಾಡ್ಯೂಲ್ ರೆಗ್ಯುಲರ್ ಎಕ್ಸ್‌ಪ್ರೆಶನ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ಹಲವು ಫಂಕ್ಷನ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಅವುಗಳಲ್ಲಿ ಪ್ರಮುಖವಾದವುಗಳನ್ನು ಇಲ್ಲಿ ವಿವರಿಸಲಾಗಿದೆ.

1. `re.search(pattern, string)`

ಈ ಫಂಕ್ಷನ್ ಇಡೀ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಪ್ಯಾಟರ್ನ್‌ಗಾಗಿ ಹುಡುಕುತ್ತದೆ ಮತ್ತು ಮೊದಲ ಮ್ಯಾಚ್ ಸಿಕ್ಕಿದ ತಕ್ಷಣ ನಿಲ್ಲಿಸುತ್ತದೆ. * ಮ್ಯಾಚ್ ಸಿಕ್ಕರೆ, ಅದು ಒಂದು ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್ (Match Object) ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. * ಮ್ಯಾಚ್ ಸಿಗದಿದ್ದರೆ, None ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ತುಂಬಾ ಸುಲಭ ಮತ್ತು ಪೈಥಾನ್ ಜನಪ್ರಿಯವಾಗಿದೆ."
pattern = r"ಪೈಥಾನ್"

match = re.search(pattern, text)

if match:
    print("ಪ್ಯಾಟರ್ನ್ ಕಂಡುಬಂದಿದೆ!")
    print(f"ಮ್ಯಾಚ್ ಆದ ಸ್ಟ್ರಿಂಗ್: '{match.group()}'")
    print(f"ಪ್ರಾರಂಭದ ಇಂಡೆಕ್ಸ್: {match.start()}")
    print(f"ಅಂತ್ಯದ ಇಂಡೆಕ್ಸ್: {match.end()}")
else:
    print("ಪ್ಯಾಟರ್ನ್ ಕಂಡುಬಂದಿಲ್ಲ.")

ಔಟ್‌ಪುಟ್:

ಪ್ಯಾಟರ್ನ್ ಕಂಡುಬಂದಿದೆ!
ಮ್ಯಾಚ್ ಆದ ಸ್ಟ್ರಿಂಗ್: 'ಪೈಥಾನ್'
ಪ್ರಾರಂಭದ ಇಂಡೆಕ್ಸ್: 0
ಅಂತ್ಯದ ಇಂಡೆಕ್ಸ್: 7

search() ಇಡೀ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಹುಡುಕುತ್ತದೆ, ಆದರೆ ಮೊದಲ ಮ್ಯಾಚ್ ಸಿಕ್ಕ ತಕ್ಷಣ ನಿಲ್ಲಿಸುತ್ತದೆ.

2. `re.match(pattern, string)`

ಈ ಫಂಕ್ಷನ್ ಸ್ಟ್ರಿಂಗ್‌ನ ಪ್ರಾರಂಭದಲ್ಲಿ ಮಾತ್ರ ಪ್ಯಾಟರ್ನ್‌ಗಾಗಿ ಹುಡುಕುತ್ತದೆ. * ಸ್ಟ್ರಿಂಗ್‌ನ ಪ್ರಾರಂಭವು ಪ್ಯಾಟರ್ನ್‌ಗೆ ಮ್ಯಾಚ್ ಆದರೆ ಮಾತ್ರ ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. * ಇಲ್ಲದಿದ್ದರೆ, None ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text1 = "ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್"
text2 = "ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಪೈಥಾನ್"
pattern = r"ಪೈಥಾನ್"

match1 = re.match(pattern, text1)
print(f"text1 ಗಾಗಿ ಮ್ಯಾಚ್: {match1}") # ಮ್ಯಾಚ್ ಆಗುತ್ತದೆ

match2 = re.match(pattern, text2)
print(f"text2 ಗಾಗಿ ಮ್ಯಾಚ್: {match2}") # ಮ್ಯಾಚ್ ಆಗುವುದಿಲ್ಲ (None)

ಔಟ್‌ಪುಟ್:

text1 ಗಾಗಿ ಮ್ಯಾಚ್: <re.Match object; span=(0, 7), match='ಪೈಥಾನ್'>
text2 ಗಾಗಿ ಮ್ಯಾಚ್: None

3. `re.findall(pattern, string)`

ಈ ಫಂಕ್ಷನ್ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಪ್ಯಾಟರ್ನ್‌ಗೆ ಮ್ಯಾಚ್ ಆಗುವ ಎಲ್ಲಾ ನಾನ್-ಓವರ್‌ಲ್ಯಾಪಿಂಗ್ (non-overlapping) ಭಾಗಗಳನ್ನು ಹುಡುಕಿ, ಅವುಗಳನ್ನು ಒಂದು ಲಿಸ್ಟ್ ಆಗಿ ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "ನನ್ನ ಇಮೇಲ್ ವಿಳಾಸಗಳು: [email protected] ಮತ್ತು [email protected]"
pattern = r"\w+@\w+\.\w+" # ಇಮೇಲ್ ವಿಳಾಸಕ್ಕಾಗಿ ಒಂದು ಸರಳ ಪ್ಯಾಟರ್ನ್

emails = re.findall(pattern, text)
print(emails)

ಔಟ್‌ಪುಟ್:

['[email protected]', '[email protected]']

findall() ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್‌ಗಳ ಬದಲು, ಮ್ಯಾಚ್ ಆದ ಸ್ಟ್ರಿಂಗ್‌ಗಳ ಲಿಸ್ಟ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

4. `re.finditer(pattern, string)`

ಇದು findall() ನಂತೆಯೇ ಕೆಲಸ ಮಾಡುತ್ತದೆ, ಆದರೆ ಸ್ಟ್ರಿಂಗ್‌ಗಳ ಲಿಸ್ಟ್ ಬದಲು, ಇದು ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್‌ಗಳ ಇಟರೇಟರ್ (iterator) ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. ದೊಡ್ಡ ಸಂಖ್ಯೆಯ ಮ್ಯಾಚ್‌ಗಳಿದ್ದಾಗ ಇದು ಹೆಚ್ಚು ಮೆಮೊರಿ-ಸಮರ್ಥವಾಗಿದೆ.

ಉದಾಹರಣೆ:

import re

text = "ನನ್ನ ಇಮೇಲ್ ವಿಳಾಸಗಳು: [email protected] ಮತ್ತು [email protected]"
pattern = r"\w+@\w+\.\w+"

matches = re.finditer(pattern, text)

for match in matches:
    print(f"ಕಂಡುಬಂದ ಇಮೇಲ್: {match.group()}, ಸ್ಥಾನ: {match.span()}")

ಔಟ್‌ಪುಟ್:

ಕಂಡುಬಂದ ಇಮೇಲ್: [email protected], ಸ್ಥಾನ: (20, 37)
ಕಂಡುಬಂದ ಇಮೇಲ್: [email protected], ಸ್ಥಾನ: (42, 56)

5. `re.sub(pattern, replacement, string)`

ಈ ಫಂಕ್ಷನ್ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಪ್ಯಾಟರ್ನ್‌ಗೆ ಮ್ಯಾಚ್ ಆಗುವ ಎಲ್ಲಾ ಭಾಗಗಳನ್ನು replacement ಸ್ಟ್ರಿಂಗ್‌ನೊಂದಿಗೆ ಬದಲಾಯಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "ನನ್ನ ಫೋನ್ ಸಂಖ್ಯೆ 123-456-7890 ಆಗಿದೆ."
pattern = r"\d{3}-\d{3}-\d{4}"
replacement = "[ಸಂಖ್ಯೆಯನ್ನು ಮರೆಮಾಡಲಾಗಿದೆ]"

new_text = re.sub(pattern, replacement, text)
print(new_text)

ಔಟ್‌ಪುಟ್:

ನನ್ನ ಫೋನ್ ಸಂಖ್ಯೆ [ಸಂಖ್ಯೆಯನ್ನು ಮರೆಮಾಡಲಾಗಿದೆ] ಆಗಿದೆ.

6. `re.split(pattern, string)`

ಈ ಫಂಕ್ಷನ್ ಪ್ಯಾಟರ್ನ್ ಮ್ಯಾಚ್ ಆಗುವ ಸ್ಥಳಗಳಲ್ಲಿ ಸ್ಟ್ರಿಂಗ್ ಅನ್ನು ವಿಭಜಿಸಿ, ಭಾಗಗಳ ಲಿಸ್ಟ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "apple,banana;cherry orange"
# ಅಲ್ಪವಿರಾಮ, ಅರ್ಧವಿರಾಮ, ಅಥವಾ ಸ್ಪೇಸ್ ಬಳಸಿ ವಿಭಜಿಸುವುದು
pattern = r"[,;\s]+"

parts = re.split(pattern, text)
print(parts)

ಔಟ್‌ಪುಟ್:

['apple', 'banana', 'cherry', 'orange']

7. `re.compile(pattern)`

ಒಂದು ರೆಗ್ಯುಲರ್ ಎಕ್ಸ್‌ಪ್ರೆಶನ್ ಪ್ಯಾಟರ್ನ್ ಅನ್ನು ನೀವು ಹಲವು ಬಾರಿ ಬಳಸುವುದಾದರೆ, ಅದನ್ನು re.compile() ಬಳಸಿ ಕಂಪೈಲ್ ಮಾಡಬಹುದು. ಇದು ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಸ್ವಲ್ಪ ವೇಗಗೊಳಿಸುತ್ತದೆ. ಕಂಪೈಲ್ ಮಾಡಿದ ಪ್ಯಾಟರ್ನ್ ಆಬ್ಜೆಕ್ಟ್ ಮೇಲೆ search(), findall() ಮುಂತಾದ ಎಲ್ಲಾ ಫಂಕ್ಷನ್‌ಗಳನ್ನು ಮೆಥಡ್‌ಗಳಾಗಿ ಕರೆಯಬಹುದು.

ಉದಾಹರಣೆ:

import re

# ಪ್ಯಾಟರ್ನ್ ಅನ್ನು ಒಮ್ಮೆ ಕಂಪೈಲ್ ಮಾಡುವುದು
email_pattern = re.compile(r"\w+@\w+\.\w+")

text1 = "ಇಮೇಲ್: [email protected]"
text2 = "ಇನ್ನೊಂದು ಇಮೇಲ್: [email protected]"

# ಕಂಪೈಲ್ ಮಾಡಿದ ಆಬ್ಜೆಕ್ಟ್ ಅನ್ನು ಬಳಸುವುದು
print(email_pattern.findall(text1))
print(email_pattern.findall(text2))

ಔಟ್‌ಪುಟ್:

['[email protected]']
['[email protected]']

ಈ ಫಂಕ್ಷನ್‌ಗಳು ಪೈಥಾನ್‌ನಲ್ಲಿ ಟೆಕ್ಸ್ಟ್ ಪ್ರೊಸೆಸಿಂಗ್‌ಗೆ ಬೇಕಾದ ಹೆಚ್ಚಿನ ರೆಜೆಕ್ಸ್ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ.

re ಮಾಡ್ಯೂಲ್‌ನ ಪ್ರಮುಖ ಫಂಕ್ಷನ್‌ಗಳು

1. re.search(pattern, string)

2. re.match(pattern, string)

3. re.findall(pattern, string)

4. re.finditer(pattern, string)

5. re.sub(pattern, replacement, string)

6. re.split(pattern, string)

7. re.compile(pattern)

`re` ಮಾಡ್ಯೂಲ್‌ನ ಪ್ರಮುಖ ಫಂಕ್ಷನ್‌ಗಳು

1. `re.search(pattern, string)`

2. `re.match(pattern, string)`

3. `re.findall(pattern, string)`

4. `re.finditer(pattern, string)`

5. `re.sub(pattern, replacement, string)`

6. `re.split(pattern, string)`

7. `re.compile(pattern)`