Pražské Pyvo #149 Engineering Of Structured, Semi-Structured And Unstructured Data & Language Models and the Non-English Languages
The meetup
took place
on
Wednesday
the 18th
of October,
2023
at 19:00.
Na Věnečku,
Ostrovského 38a, Praha 5, Czech Republic, 15000
→ map (mapy.cz)
Co tě čeká
Sraz je v 19 hodin Na Věnečku, přednášky začínají v 19.30. Čekají nás 2 přednášky, lightning talky a volná zábava až do rána.
Lightning talk můžeš mít i ty! Registrace nutná na Lightning Talks – bit.ly/prpylight.
What to expect
We meet up at 19 at the club Na Věnečku, presentations start at 19.30. You can look forward to 3 presentations, lightning talks and chit-chat until early morning.
You can have a lightning talk as well – please register at Lightning Talks – bit.ly/prpylight.
Obecné
- Na Pyvu jsou přednášky většinou česky, pokud přijde někdo, kdo česky nerozumí, přepneme do angličtiny, pokud se na to přednášející cítí.
- Kromě nealko a alko pití je možné se Na Věnečku najíst. Nabídka je proměnlivá a obvykle jde o 4 až 7 jídel od toastu, párků, přes bramborák se zelím, dršťkovou polévku a smažák v housce až po guláš nebo řízek.
- Nezapomeň s sebou vzít hotovost – neberou karty.
- Na Věnečku zavírají o půlnoci.
General
- Talks at Pyvo are mostly in Czech but it there’s somebody who doesn’t understand Czech talks are switched to English if the speaker is able to.
- Cash only payments – club doesn’t accept cards.
- Besides both soft drinks and beer it's possible to eat at the club. Choice is variable and consists of 4 to 7 options ranging from toast, sausages and soup to fried cheese in a bun, goulash or schnitzel.
- Club closes at midnight.
Talks
Engineering Of Structured, Semi-Structured And Unstructured Data
- This talk tries giving an insight on various data types in business/academia and what are the clean approaches to be able to work with such data types. (for example, the difference between preprocessing of a csv file and an image)
Language Models and the Non-English Languages
- In this presentation, we'll explore the details of language models when handling non-English languages. We'll dive into the token usage across different languages to understand if queries in non-English languages incur higher costs compared to English. Additionally, we'll investigate the nuances of embedding distances for non-English terms, both in their native form and after translation to English, shedding light on potential variations and their implications.
Venue
Na Věnečku,
Ostrovského 38a, Praha 5, Czech Republic, 15000
Jedná se o soukromý klub, takže nikde není žádná cedule.
Když Ostrovského ulice přejde v chodník se zábradlím po obou stranách, jděte 60 metrů do kopce.
První brána po pravé straně je vchod do dvora.
Ujděte ještě 40 metrů a vchod do klubu najdete vlevo.
It’s a private club with no public signs.
After Ostrovského street becomes a footpath walk 60 meters uphill.
Club is in the first gate to the right.
Go 40 more meters and entrance to the club will be to your left.
Na Věnečku @ Google Maps