Standaardoplossingen gebaseerd op keywords of labels, dat is een optie van OSG. Zoals antwoord op de vraag: wat is uw gewenste beroep en op welke locatie zou u graag werken? Dit is een belangrijk voordeel van onze zoekmachine.
De kern van een standaard matching oplossing zit vooral in de zoekwoorden. Dit zijn basis-zoekwoorden die dikwijls verschijnen in vacatureteksten en in CV's. Hoe specifieker ze zijn, hoe hoger de successcore. Generieke zoekwoorden hebben bijna geen successcore en krijgen dus geen kans om CV's of vacatures te selecteren. Er zijn een aantal opties tijdens het matching proces. Neem de vacature-tekst als vertrekpunt en zoek kandidaten via titels. Of start bijvoorbeeld met een CV-profiel, gebaseerd op de meest recente werkervaring, studieniveau, locatie en andere zaken.
CV profielen zoeken is een nauwkeurig klusje voor een beperkte generieke selectie. Matching mechanisme kan uiteindelijk zijn database gebruiken om geweldige kandidaten te selecteren. Met onze functie voor het zoeken naar profielen, levert zoeken naar bijvoorbeeld 'frontend-engineer' interessante en bruikbare resultaten op voor kandidaten met HTML-, CSS- en JavaScript-vaardigheden. Daardoor hoeft u geen Booleaans in te zetten met onder andere een tiental 'OR'-opties.
Stel dat u naar HTML zoekt, dan worden alle fronted developers gevonden. Dit is een interessante optie als u zoekt in een beperkte database. Het levert goede resultaten op, zodat u niet telkens met OR hoeft te zoeken. Maar we hebben ontdekt dat deze manier van werken minder effectief werkt als u zoekt in duizenden kandidaten. Dan wordt het resultaat te generiek en worden voortdurend dezelfde CV's geselecteerd. Daarom hebben we een dynamische que van index gemaakt, zodat iedere CV eenmaal per tijdperk kan worden gecontacteerd. Een keer in de gewenste cyclus per maand of per week. Het probleem bij deze aanpak is ook dat C++ en C# en Java developers als één groep worden gezien en dat is minder handig als we nauwkeurig voor knelpuntberoepen willen zoeken. Daarom zijn we overgestapt naar iets dat de beste eigenschappen van verschillende methoden combineert.
Eigenlijk vertrekt u vanuit het midden. U heeft veel gebruikte zoekwoorden, labels en doet aan matchen met locatie en/of meerdere labels. De beste labels zijn die van gespecificeerde beroepsgroepen en kennis. Hoe meer labels met elkaar matchen, hoe beter de relevantie. We starten daarom in het midden. Als de cyclus gedaan is, dan kijken we welke jobs nog geen kandidaten hebben en welke CV nog geen job voorstel heeft. Dat zijn dus overige vacatures en CV's die ons ML algoritme nog moeten leren. In onze ervaring zijn dat meestal CV's met te weinig ervaring of vacatures die een zeer korte of vage omschrijving bevatten, of in een vreemde taal geschreven zijn. Engineer kan dan semi-automatisch ML werking bijsturen, zodat u ook deze CV's en vacatures krijgt.
We verbeteren onze zoekresultaten en houden rekening met volgende criteria: Spelling, Seniority, Concept, Jargon, Acronym en Location.
Met ML als basis scant OSG de nauwkeurigheid van elke functieomschrijving, vacaturezoekopdracht of profielzoekopdracht. Dit wordt gerealiseerd door het gebruik van vertrouwensscores op basis van brede categorieën (IT) en specifiekere beroepsgroepen (Fronted Angular Developer, Backend Python Developer, Full Stack Developer, Tester, Netwerk Beheerder ). Met deze oplossing wordt het gemakkelijker om de juiste kandidaten te vinden. Tevens wordt de totale wervingstijd flink ingekort. Invoer van vacatures wordt ook gemakkelijker, omdat u niet langer categorieën hoeft aan te geven voor latere exacte matching. Dit zorgt voor minder fouten tijdens het kiezen van categorieën, want mensen die vacatures invoeren hebben meestal weinig kennis over beroep zelf en weten niet wat geselecteerd moet worden in subcategorieën.
https://www.vindazo.be/pages/technologie/ CV parsing, semantische search, matching kandidaten
Als voor een beslissing weinig factoren nodig zijn, gebruiken we een beslissingsboom. Bij veel factoren, of als er factoren nodig zijn tijdens het verwerken, gebruiken we het Neural network of de Bayesiaans methode. https://www.tensorflow.org/probability
Voordelen van de Bayesiaans methode:
De kern van een standaard matching oplossing zit vooral in de zoekwoorden. Dit zijn basis-zoekwoorden die dikwijls verschijnen in vacatureteksten en in CV's. Hoe specifieker ze zijn, hoe hoger de successcore. Generieke zoekwoorden hebben bijna geen successcore en krijgen dus geen kans om CV's of vacatures te selecteren. Er zijn een aantal opties tijdens het matching proces. Neem de vacature-tekst als vertrekpunt en zoek kandidaten via titels. Of start bijvoorbeeld met een CV-profiel, gebaseerd op de meest recente werkervaring, studieniveau, locatie en andere zaken.
CV profielen zoeken is een nauwkeurig klusje voor een beperkte generieke selectie. Matching mechanisme kan uiteindelijk zijn database gebruiken om geweldige kandidaten te selecteren. Met onze functie voor het zoeken naar profielen, levert zoeken naar bijvoorbeeld 'frontend-engineer' interessante en bruikbare resultaten op voor kandidaten met HTML-, CSS- en JavaScript-vaardigheden. Daardoor hoeft u geen Booleaans in te zetten met onder andere een tiental 'OR'-opties.
Stel dat u naar HTML zoekt, dan worden alle fronted developers gevonden. Dit is een interessante optie als u zoekt in een beperkte database. Het levert goede resultaten op, zodat u niet telkens met OR hoeft te zoeken. Maar we hebben ontdekt dat deze manier van werken minder effectief werkt als u zoekt in duizenden kandidaten. Dan wordt het resultaat te generiek en worden voortdurend dezelfde CV's geselecteerd. Daarom hebben we een dynamische que van index gemaakt, zodat iedere CV eenmaal per tijdperk kan worden gecontacteerd. Een keer in de gewenste cyclus per maand of per week. Het probleem bij deze aanpak is ook dat C++ en C# en Java developers als één groep worden gezien en dat is minder handig als we nauwkeurig voor knelpuntberoepen willen zoeken. Daarom zijn we overgestapt naar iets dat de beste eigenschappen van verschillende methoden combineert.
Eigenlijk vertrekt u vanuit het midden. U heeft veel gebruikte zoekwoorden, labels en doet aan matchen met locatie en/of meerdere labels. De beste labels zijn die van gespecificeerde beroepsgroepen en kennis. Hoe meer labels met elkaar matchen, hoe beter de relevantie. We starten daarom in het midden. Als de cyclus gedaan is, dan kijken we welke jobs nog geen kandidaten hebben en welke CV nog geen job voorstel heeft. Dat zijn dus overige vacatures en CV's die ons ML algoritme nog moeten leren. In onze ervaring zijn dat meestal CV's met te weinig ervaring of vacatures die een zeer korte of vage omschrijving bevatten, of in een vreemde taal geschreven zijn. Engineer kan dan semi-automatisch ML werking bijsturen, zodat u ook deze CV's en vacatures krijgt.
We verbeteren onze zoekresultaten en houden rekening met volgende criteria: Spelling, Seniority, Concept, Jargon, Acronym en Location.
Met ML als basis scant OSG de nauwkeurigheid van elke functieomschrijving, vacaturezoekopdracht of profielzoekopdracht. Dit wordt gerealiseerd door het gebruik van vertrouwensscores op basis van brede categorieën (IT) en specifiekere beroepsgroepen (Fronted Angular Developer, Backend Python Developer, Full Stack Developer, Tester, Netwerk Beheerder ). Met deze oplossing wordt het gemakkelijker om de juiste kandidaten te vinden. Tevens wordt de totale wervingstijd flink ingekort. Invoer van vacatures wordt ook gemakkelijker, omdat u niet langer categorieën hoeft aan te geven voor latere exacte matching. Dit zorgt voor minder fouten tijdens het kiezen van categorieën, want mensen die vacatures invoeren hebben meestal weinig kennis over beroep zelf en weten niet wat geselecteerd moet worden in subcategorieën.
https://www.vindazo.be/pages/technologie/ CV parsing, semantische search, matching kandidaten
Het antwoord op de vraag: wat gebruiken jullie voor ML?
Onze functies zijn gebaseerd op verschillende methoden, namelijk die van Bayesiaans, Neural network en Statistiek tree. We gebruiken meestal het Python frameworks met open source implementaties (tensorflow). De bedoeling is dat we de beste match voorspellen als we alle verwachtingen kunnen inleven. De gebruikte methoden concurreren niet in ons systeem, maar helpen elkaar en worden tevens gecombineerd, want bepaalde algoritmen geven het beste resultaat voor de vooraf bepaalde doelstellingen.Als voor een beslissing weinig factoren nodig zijn, gebruiken we een beslissingsboom. Bij veel factoren, of als er factoren nodig zijn tijdens het verwerken, gebruiken we het Neural network of de Bayesiaans methode. https://www.tensorflow.org/probability
Voordelen van de Bayesiaans methode:
- Er is minder kans op over leren;
- Er is een compositie met verschillende modellen;
- Herleren is mogelijk zonder vorige bewaarde data;
- De methode doet aan rubricatie en dit zorgt voor extra categorieën / labels uit bestaande gegevens;
- Het kan worden gebruikt voor big data.
Reacties
Een reactie posten