ವಿಷಯಕ್ಕೆ ತೆರಳಿ

re ಮಾಡ್ಯೂಲ್‌ನ ಪ್ರಮುಖ ಫಂಕ್ಷನ್‌ಗಳು

re ಮಾಡ್ಯೂಲ್ ರೆಗ್ಯುಲರ್ ಎಕ್ಸ್‌ಪ್ರೆಶನ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ಹಲವು ಫಂಕ್ಷನ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ. ಅವುಗಳಲ್ಲಿ ಪ್ರಮುಖವಾದವುಗಳನ್ನು ಇಲ್ಲಿ ವಿವರಿಸಲಾಗಿದೆ.


1. re.search(pattern, string)

ಈ ಫಂಕ್ಷನ್ ಇಡೀ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಪ್ಯಾಟರ್ನ್‌ಗಾಗಿ ಹುಡುಕುತ್ತದೆ ಮತ್ತು ಮೊದಲ ಮ್ಯಾಚ್ ಸಿಕ್ಕಿದ ತಕ್ಷಣ ನಿಲ್ಲಿಸುತ್ತದೆ. * ಮ್ಯಾಚ್ ಸಿಕ್ಕರೆ, ಅದು ಒಂದು ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್ (Match Object) ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. * ಮ್ಯಾಚ್ ಸಿಗದಿದ್ದರೆ, None ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ತುಂಬಾ ಸುಲಭ ಮತ್ತು ಪೈಥಾನ್ ಜನಪ್ರಿಯವಾಗಿದೆ."
pattern = r"ಪೈಥಾನ್"

match = re.search(pattern, text)

if match:
    print("ಪ್ಯಾಟರ್ನ್ ಕಂಡುಬಂದಿದೆ!")
    print(f"ಮ್ಯಾಚ್ ಆದ ಸ್ಟ್ರಿಂಗ್: '{match.group()}'")
    print(f"ಪ್ರಾರಂಭದ ಇಂಡೆಕ್ಸ್: {match.start()}")
    print(f"ಅಂತ್ಯದ ಇಂಡೆಕ್ಸ್: {match.end()}")
else:
    print("ಪ್ಯಾಟರ್ನ್ ಕಂಡುಬಂದಿಲ್ಲ.")
ಔಟ್‌ಪುಟ್:
ಪ್ಯಾಟರ್ನ್ ಕಂಡುಬಂದಿದೆ!
ಮ್ಯಾಚ್ ಆದ ಸ್ಟ್ರಿಂಗ್: 'ಪೈಥಾನ್'
ಪ್ರಾರಂಭದ ಇಂಡೆಕ್ಸ್: 0
ಅಂತ್ಯದ ಇಂಡೆಕ್ಸ್: 7
search() ಇಡೀ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಹುಡುಕುತ್ತದೆ, ಆದರೆ ಮೊದಲ ಮ್ಯಾಚ್ ಸಿಕ್ಕ ತಕ್ಷಣ ನಿಲ್ಲಿಸುತ್ತದೆ.


2. re.match(pattern, string)

ಈ ಫಂಕ್ಷನ್ ಸ್ಟ್ರಿಂಗ್‌ನ ಪ್ರಾರಂಭದಲ್ಲಿ ಮಾತ್ರ ಪ್ಯಾಟರ್ನ್‌ಗಾಗಿ ಹುಡುಕುತ್ತದೆ. * ಸ್ಟ್ರಿಂಗ್‌ನ ಪ್ರಾರಂಭವು ಪ್ಯಾಟರ್ನ್‌ಗೆ ಮ್ಯಾಚ್ ಆದರೆ ಮಾತ್ರ ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. * ಇಲ್ಲದಿದ್ದರೆ, None ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text1 = "ಪೈಥಾನ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್"
text2 = "ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಪೈಥಾನ್"
pattern = r"ಪೈಥಾನ್"

match1 = re.match(pattern, text1)
print(f"text1 ಗಾಗಿ ಮ್ಯಾಚ್: {match1}") # ಮ್ಯಾಚ್ ಆಗುತ್ತದೆ

match2 = re.match(pattern, text2)
print(f"text2 ಗಾಗಿ ಮ್ಯಾಚ್: {match2}") # ಮ್ಯಾಚ್ ಆಗುವುದಿಲ್ಲ (None)
ಔಟ್‌ಪುಟ್:
text1 ಗಾಗಿ ಮ್ಯಾಚ್: <re.Match object; span=(0, 7), match='ಪೈಥಾನ್'>
text2 ಗಾಗಿ ಮ್ಯಾಚ್: None


3. re.findall(pattern, string)

ಈ ಫಂಕ್ಷನ್ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಪ್ಯಾಟರ್ನ್‌ಗೆ ಮ್ಯಾಚ್ ಆಗುವ ಎಲ್ಲಾ ನಾನ್-ಓವರ್‌ಲ್ಯಾಪಿಂಗ್ (non-overlapping) ಭಾಗಗಳನ್ನು ಹುಡುಕಿ, ಅವುಗಳನ್ನು ಒಂದು ಲಿಸ್ಟ್ ಆಗಿ ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "ನನ್ನ ಇಮೇಲ್ ವಿಳಾಸಗಳು: [email protected] ಮತ್ತು [email protected]"
pattern = r"\w+@\w+\.\w+" # ಇಮೇಲ್ ವಿಳಾಸಕ್ಕಾಗಿ ಒಂದು ಸರಳ ಪ್ಯಾಟರ್ನ್

emails = re.findall(pattern, text)
print(emails)
ಔಟ್‌ಪುಟ್: findall() ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್‌ಗಳ ಬದಲು, ಮ್ಯಾಚ್ ಆದ ಸ್ಟ್ರಿಂಗ್‌ಗಳ ಲಿಸ್ಟ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.


4. re.finditer(pattern, string)

ಇದು findall() ನಂತೆಯೇ ಕೆಲಸ ಮಾಡುತ್ತದೆ, ಆದರೆ ಸ್ಟ್ರಿಂಗ್‌ಗಳ ಲಿಸ್ಟ್ ಬದಲು, ಇದು ಮ್ಯಾಚ್ ಆಬ್ಜೆಕ್ಟ್‌ಗಳ ಇಟರೇಟರ್ (iterator) ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. ದೊಡ್ಡ ಸಂಖ್ಯೆಯ ಮ್ಯಾಚ್‌ಗಳಿದ್ದಾಗ ಇದು ಹೆಚ್ಚು ಮೆಮೊರಿ-ಸಮರ್ಥವಾಗಿದೆ.

ಉದಾಹರಣೆ:

import re

text = "ನನ್ನ ಇಮೇಲ್ ವಿಳಾಸಗಳು: [email protected] ಮತ್ತು [email protected]"
pattern = r"\w+@\w+\.\w+"

matches = re.finditer(pattern, text)

for match in matches:
    print(f"ಕಂಡುಬಂದ ಇಮೇಲ್: {match.group()}, ಸ್ಥಾನ: {match.span()}")
ಔಟ್‌ಪುಟ್:
ಕಂಡುಬಂದ ಇಮೇಲ್: [email protected], ಸ್ಥಾನ: (20, 37)
ಕಂಡುಬಂದ ಇಮೇಲ್: [email protected], ಸ್ಥಾನ: (42, 56)


5. re.sub(pattern, replacement, string)

ಈ ಫಂಕ್ಷನ್ ಸ್ಟ್ರಿಂಗ್‌ನಲ್ಲಿ ಪ್ಯಾಟರ್ನ್‌ಗೆ ಮ್ಯಾಚ್ ಆಗುವ ಎಲ್ಲಾ ಭಾಗಗಳನ್ನು replacement ಸ್ಟ್ರಿಂಗ್‌ನೊಂದಿಗೆ ಬದಲಾಯಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "ನನ್ನ ಫೋನ್ ಸಂಖ್ಯೆ 123-456-7890 ಆಗಿದೆ."
pattern = r"\d{3}-\d{3}-\d{4}"
replacement = "[ಸಂಖ್ಯೆಯನ್ನು ಮರೆಮಾಡಲಾಗಿದೆ]"

new_text = re.sub(pattern, replacement, text)
print(new_text)
ಔಟ್‌ಪುಟ್:
ನನ್ನ ಫೋನ್ ಸಂಖ್ಯೆ [ಸಂಖ್ಯೆಯನ್ನು ಮರೆಮಾಡಲಾಗಿದೆ] ಆಗಿದೆ.


6. re.split(pattern, string)

ಈ ಫಂಕ್ಷನ್ ಪ್ಯಾಟರ್ನ್ ಮ್ಯಾಚ್ ಆಗುವ ಸ್ಥಳಗಳಲ್ಲಿ ಸ್ಟ್ರಿಂಗ್ ಅನ್ನು ವಿಭಜಿಸಿ, ಭಾಗಗಳ ಲಿಸ್ಟ್ ಅನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.

ಉದಾಹರಣೆ:

import re

text = "apple,banana;cherry orange"
# ಅಲ್ಪವಿರಾಮ, ಅರ್ಧವಿರಾಮ, ಅಥವಾ ಸ್ಪೇಸ್ ಬಳಸಿ ವಿಭಜಿಸುವುದು
pattern = r"[,;\s]+"

parts = re.split(pattern, text)
print(parts)
ಔಟ್‌ಪುಟ್:
['apple', 'banana', 'cherry', 'orange']


7. re.compile(pattern)

ಒಂದು ರೆಗ್ಯುಲರ್ ಎಕ್ಸ್‌ಪ್ರೆಶನ್ ಪ್ಯಾಟರ್ನ್ ಅನ್ನು ನೀವು ಹಲವು ಬಾರಿ ಬಳಸುವುದಾದರೆ, ಅದನ್ನು re.compile() ಬಳಸಿ ಕಂಪೈಲ್ ಮಾಡಬಹುದು. ಇದು ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಸ್ವಲ್ಪ ವೇಗಗೊಳಿಸುತ್ತದೆ. ಕಂಪೈಲ್ ಮಾಡಿದ ಪ್ಯಾಟರ್ನ್ ಆಬ್ಜೆಕ್ಟ್ ಮೇಲೆ search(), findall() ಮುಂತಾದ ಎಲ್ಲಾ ಫಂಕ್ಷನ್‌ಗಳನ್ನು ಮೆಥಡ್‌ಗಳಾಗಿ ಕರೆಯಬಹುದು.

ಉದಾಹರಣೆ:

import re

# ಪ್ಯಾಟರ್ನ್ ಅನ್ನು ಒಮ್ಮೆ ಕಂಪೈಲ್ ಮಾಡುವುದು
email_pattern = re.compile(r"\w+@\w+\.\w+")

text1 = "ಇಮೇಲ್: [email protected]"
text2 = "ಇನ್ನೊಂದು ಇಮೇಲ್: [email protected]"

# ಕಂಪೈಲ್ ಮಾಡಿದ ಆಬ್ಜೆಕ್ಟ್ ಅನ್ನು ಬಳಸುವುದು
print(email_pattern.findall(text1))
print(email_pattern.findall(text2))
ಔಟ್‌ಪುಟ್: ಈ ಫಂಕ್ಷನ್‌ಗಳು ಪೈಥಾನ್‌ನಲ್ಲಿ ಟೆಕ್ಸ್ಟ್ ಪ್ರೊಸೆಸಿಂಗ್‌ಗೆ ಬೇಕಾದ ಹೆಚ್ಚಿನ ರೆಜೆಕ್ಸ್ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ.